◇ 第183回 自然言語処理研究会

第89回情報学基礎研究会との共催です.
◎日時 平成20年 1月21日(月)10:00 ~ 17:30
          22日(火) 9:30 ~ 17:30

◎会場 国立情報学研究所 12階1208+1210会議室

〔交通手段〕
東京メトロ半蔵門線/都営地下鉄三田線・新宿線「神保町」A8出口
東京メトロ東西線「竹橋」1b出口
徒歩3~5分
http://www.nii.ac.jp/introduce/access1-j.shtml

◎問い合わせ先

  • 会場・研究会に関する問い合わせ先:
    乾 健太郎 (奈良先端科学技術大学院大学)
    E-mail: inui (at) is.naist.jp

【プログラム】(発表件数23件)

1月21日(月) ― 10:00 ~ 17:30 ―
[10:00~10:40] ● チュートリアル 〔1件〕
[10:40~11:40] ● 特許分類・質問応答 〔2件〕
[13:00~17:30] ● NTCIR特別セッション 〔5件〕

1月22日(火) ― 9:30 ~ 17:30 ―
[ 9:30~11:30] ● Web情報アクセス 〔4件〕
[12:45~15:15] ● 語彙・意味 〔5件〕
[15:30~17:30] ● 翻訳・応用 〔4件〕


※1月21日(月)の御発表のうち,2件が取り消しとなりました.これに伴いまして, 同日のプログラムに変更がございます.
(21日のみ,開始予定時刻が30分繰り下がって10時に変更になっております.ご注意ください.)


1月21日(月) ― 10:00 ~ 17:30 ―

[10:00~10:40] ● チュートリアル 〔1件〕
1. チュートリアル:情報検索テストコレクションと評価指標

○酒井哲也 (ニューズウォッチ)

情報検索テストコレクションや情報検索評価指標について概説し,
情報検索研究における適切な評価方法について論じる.

[10:40~11:40] ● 特許分類・質問応答 〔2件〕

2. 特許文書の多観点分類について

○田中一成(富士通研究所)

特許文書を対象に,発明の対象や目的・課題といった観点で自動分
類を行う技術を開発したので報告する.

3. Web検索エンジンを用いたWhy型質問応答システムに関する研究

○田村元秀,村上仁一,徳久雅人,池原悟(鳥取大)

質問応答技術に関して,インターネット上のWeb検索エンジンを利
用することによりWhy型質問に回答するシステムを提案・評価する

11:40-13:00 <昼休み80分(NL研・FI研運営委員会)>

[13:00~17:30] ● NTCIR特別セッション 〔5件〕

13:00-14:20
4. 情報アクセス技術の性能評価のための研究基盤NTCIR:
言語横断検索の創成と展開 

○神門 典子(国立情報学研究所),岸田和明(慶應義塾大学),
栗山和子(白百合女子大学),
KH Chen (National Taiwan University),
HH Chen (National Taiwan University),
Sung Hyon Myaeng (International Communication University),
Sukhoon Lee (National Chungnam University)

情報検索と自然言語処理が融合した情報アクセス技術の研究促進を
めざしてきたNTCIR-1から-6までの活動を,言語横断を中心に概観し,
展望を述べる.

14:20-15:10
5. 特許情報処理を指向したテストコレクションの構築:
情報検索と自然言語処理の融合を目指して

○藤井 敦(筑波大学),○難波 英嗣(広島市立大学),
岩山 真(東京工業大学/日立製作所),
神門 典子(国立情報学研究所),内山 将夫(情報通信研究機構),
山本 幹雄(筑波大学),宇津呂 武仁(筑波大学),
橋本 泰一(東京工業大学)

NTCIRの特許情報テストコレクションについて,検索,分類,機械翻訳,
マイニングの観点から解説し,今後の展望について述べる.

15:20-15:50
6. 観点に着目した特許分類手法の高精度化の提案 

○水本浩司,湯川高志(長岡技大)

NTCIR6の特許分類タスクにおいて提案した,カイ自乗統計量を用
いた分類手法の速度的優位性を保ったままで,精度を向上させる手法を
提案する.本手法は,Fタームの観点を強調するものであり,3%程度の
精度向上を得た.

15:50-16:40
7. NTCIRにおける質問応答技術の評価と今後の展望

○森 辰則 (横浜国立大学),福本 淳一 (立命館大学),
加藤 恒昭 (東京大学),桝井 文人 (三重大学),
佐々木裕 (The University of Manchester),
Hsin-Hsi Chen (National Taiwan University),
Kuang-hua Chen (National Taiwan University),
Chuan-Jie Lin (National Taiwan Ocean University),
三田村 照子 (Carnegie Mellon University),
Eric Nyberg (Carnegie Mellon University),
神門 典子 (国立情報学研究所)

NTCIRにおいて実施された質問応答技術の評価について解説をするとともに,
現在進行中の言語横断情報アクセス技術に関する新しい評価の枠組である
ACLIA(Advanced Cross-lingual Information Access)について述べ,情報
アクセス技術の評価に関する今後を展望する.

16:40-17:30
8. 多言語意見分析タスク:ニュースとブログ

○関 洋平(豊橋技術科学大学),David Kirk Evans(国立情報学研究所),
Hsin-Hsi Chen(国立台湾大学),Lun-Wei Ku(国立台湾大学),
神門 典子(国立情報学研究所)

日英中3ヶ国語の新聞記事を対象として,意見性,極性,ホルダなどの抽出技術
について評価を行い,6カ国12チームからの参加があったNTCIR-6意見分析タスク
の成果概要と,NTCIR-7のプランを報告する.

1月22日(火) ― 9:30 ~ 17:30 ―

[ 9:30~11:30] ● Web情報アクセス 〔4件〕

9. blog分類のための半教師有り学習

○池田大介,高村大也,奥村学(東京工大)

各blogのスタイルや内容といった情報を利用した,blog分類のため
の半教師あり学習手法を提案する.

10. 検索エンジン基盤TSUBAKIを用いた大規模ウェブ情報クラスタリン
グシステムの構築

○馬場康夫,新里圭司.黒橋禎夫(京都大)

検索エンジンTSUBAKIを使って検索されたページを,ページに含ま
れる複合名詞に注目して自動分類するシステムについて述べる.

11. 事態抽出のための事実性解析

○原一夫,乾健太郎(奈良先端大)

言語で書かれた事態の事実性について,時間・極性・ムードの観点
から解析する枠組みを提案し,blogを対象とする実験結果を報告す
る.

12. blogを対象とした薬剤服用情報抽出手法

○高橋美佳,荒木健治(北海道大)

blogを対象として薬剤に関する経験談の抽出を行う情報収集支援シ
ステムを作成し,その評価実験を行った結果について報告する.

11:30-12:45 <昼休み75分>

[12:45~15:15] ● 語彙・意味 〔5件〕

13. 用語クラスタリングに基づく部分研究領域推定と用語分類

○小山照夫(国立情報学研究所),竹内孔一(岡山大)

論文抄録コーパスに出現する用語性の高い形態素を,サ変名詞との
共起に基づきクラスタリングを行うことにより部分研究領域を推定
するとともに,用語侯補を部分領域に分類する試みに付いて発表す
る.

14. Web情報を利用した確率モデルによる略語推定

○村山紀文,奥村学(東京工大)

与えられた語に対する略語推定を行う,Noisy-Channel modelと
Webからの情報を組み合わせた統計モデルを提案する.

15. 枝分かれ同時確率モデルを用いた「AのB」の意味分類

○森山健太,但馬康宏(東京農工大),藤本浩司(テンソル・コン
サルティング),小谷善行(東京農工大)

2単語の概念共起確率を,各概念の上位概念を用いて近似すること
により,文中の「AのB」の意味を分類した.

16. 単語の概念関係を用いた段落一貫性評価指標の有効性

○板倉由知,白井治彦,黒岩丈介,小高知宏,小倉久和(福井大)

EDR概念辞書を用い単語間の意味類似性から,段落の一貫性を評価
するための指標を提案し,その有効性を示す.

17. 辞書に依存しない文章間類似度の比較評価手法

○村上智哉,中谷直司,厚井裕司(岩手大),後沢忍(三菱電機)

文章中における特定の文字列に着目することで,改変前と改変後の
文章間に類似点を見出す手法の提案

[15:30~17:30] ● 翻訳・応用 〔4件〕

18. 結合価パターンを用いた日中機械翻訳システムの構築

○楊鵬,池原悟,村上仁一,徳久雅人(鳥取大)

日中機械翻訳の一つの方法として,結合価パターンを使用し,機械
翻訳システムを試作する.

19. 学習型機械翻訳手法における省略可能性を用いた翻訳ルールの自動
獲得とその有効性

○寺島涼(北大),越前谷博(北海学園大),荒木健治(北大)

翻訳例から翻訳ルールを自動獲得する学習型機械翻訳手法におい
て,翻訳例中の省略可能な部分に着目することで効率よく汎用的な
翻訳ルールを獲得する手法を提案する.

20. 科学技術白書の計量的分析による科学技術政策の可視化

○石塚隆男(亜細亜大)

過去20年間の科学技術白書の目次情報と新聞の科学技術関係記事
を用い,情報量の変化により政策の変化を追跡する.

21. Web文書を活用したn-gramモデルによる手書き自由記述アンケート
の自動認識法

○泉谷達庸,松本章代,鈴木雅人(東京工業高専)

Web文書を活用し,コーパスを動的に再構築することで,手書き自
由記述アンケートの誤認識訂正を行う.

プログラムの先頭へ戻る。


作成日: 平成19年12月 6日
最終更新日: 平成20年 1月16日

◇ 第182回 自然言語処理研究会

◎日時 平成19年11月19日(月)13:30 ~ 17:15
          20日(火)10:00 ~ 15:15

◎会場 静岡大学 情報学部 2号館 3F 大会議室
〒432-8011 浜松市中区城北3-5-1

〔交通手段〕
JR浜松駅下車 北口バスターミナル15,16番のりばから
「静岡大学」下車
(所要時間約20分、1時間に10本程度運行)
http://www.shizuoka.ac.jp/ippan/hamamatsu.html

◎問い合わせ先

  • 会場に関する問い合わせ先:
    梶 博行 (かじ ひろゆき) (静岡大学情報学部情報科学科)
    E-mail: kaji (at) inf.shizuoka.ac.jp
    Tel & Fax: 053-478-1463
  • 研究会に関する問い合わせ先:
    森 辰則 (もり たつのり) (横浜国立大学)
    E-mail: mori (at) forest.eis.ynu.ac.jp
    Tel & Fax: (045)339-4132

【プログラム】(発表件数15件)

11月19日(月) ― 13:30 ~ 17:15 ―
[13:30~15:00] ● 評価表現・構文解析 〔3件〕
[15:15~17:15] ● 述語/動詞の言い換えとクラスタリング・分析 〔4件〕

11月20日(火) ― 10:00 ~ 15:15 ―
[10:00~12:00] ● 情報抽出・ラベル付与 〔4件〕
[13:15~15:15] ● 多言語処理・質問応答 〔4件〕


※11月19日(月)の御発表のうち,1件が取り消しとなりました.これに伴いまして, 同日の最初のセッションが4件から3件となり,同日の開始時刻が30分繰り下がりました.


11月19日(火) ― 13:30 ~ 17:15 ―

[13:30~15:00] ● 評価表現・構文解析 〔3件〕

1. A consideration of sentiment analysis methodologies for
classification of political opinion texts

○Tony Mullen(津田塾大学),Robert Malouf (San Diego State University)

We describe ongoing experiments in classifing texts by the
political orientation of the writers by means of sentiment
analysis techniques applied to the informal political
domain. Experiments with several approaches based on well-known
sentiment analysis methodologies are described, along with the
motivations for applying them and a description of the challenges
we have encountered.

2. GLRをベースにした自然言語処理用MSLRパーザの改良

○田中穂積(中京大学),野呂智哉(東京工業大学),植木正裕(国立国語研究所)

自然言語で書かれた文書を機械的に処理するMSLRパーザの概要を説明し、
その問題点を指摘するとともに、それを解決し、改良したMSLRパーザに
ついて説明する。

3. 係り先候補の相対的な距離を反映した統計的日本語係り受け解析

○山本悠二,増山繁(豊橋技術科学大学)

係り元と個々の係り先候補間における絶対的な距離ではなく,相対的な
距離を考慮した統計的日本語係り受け手法を提案する.

[15:15~17:15] ● 述語/動詞の言い換えとクラスタリング・分析 〔4件〕

4. 述語句統語的異形間の言い換えらしさの計算手法

○藤田篤,佐藤理史(名古屋大学)

述語句の複数の内容語を組み換えることで種々の統語的異形を生成し,
言語的適格性および元の句との意味の同義性を推定する.

5. メタファ分析に基づく置換可能な動詞カテゴリの作成

○一ノ瀬 充,竹内 孔一 (岡山大学)

メタファまで含めた言語処理に必要と考えられる動詞の属性を中心とし
たカテゴリー分類について議論する。

6. グラフ構造に基づく同時クラスタリングを利用した動詞の属性クラスの抽出

竹内孔一 (岡山大学)

複数の動詞に共通する属性があると仮定し、コーパスからクラスタリン
グにより共通属性を持つ動詞のクラスを作成する手法と結果について述
べる。

7. 日本語文章における順方向と逆方向の文字遷移情報量の差異

○中川正樹,朱碧蘭 (東京農工大学)

自然言語における文字遷移の情報量として順方向と逆方向を考え,それ
ぞれについて前後2文字の文字遷移の情報量を遷移確率上位の有限個だけ
加算した場合,日本語では順方向と逆方向で顕著な差異があることを示
す.

11月20日(火) ― 10:00 ~ 15:15 ―

[10:00~12:00] ● 情報抽出・ラベル付与 〔4件〕

8. 文書からの組織名抽出における辞書利用

○乾孝司,村上浩司,橋本泰一,内海和夫,石川正道 (東京工業大学)

文書から組織名情報を自動抽出する際に,組織名辞書の情報が抽出精度
に与える効果について検討する.

9. 専門用語抽出における助詞情報の利用に関する一考察

○村上浩司,乾孝司,橋本泰一,内海和夫,石川正道 (東京工業大学)

専門用語抽出において、語の統計情報や構造を利用した既存手法に助詞
情報を加えた際の抽出精度の変化について検証した。

10. 部分的かつ曖昧なラベル付き構造データからのマルコフ条件付確率場の学習

○坪井祐太,鹿島久嗣 (日本アイ・ビー・エム),森 信介(京都大学),
小田裕樹 ( ),松本 裕治 (奈良先端科学技術大学院大学)

コーパスのアノテーション作業では、重要な部分のみへのラベル付与や、
一部のラベルが一つに決定できずラベルの曖昧性が残ってしまうことが
発生する。 本研究では、このような部分的かつ曖昧なラベルが付与され
た学習データを使用してマルコフ条件付確率場を学習する方法を提案す
る。

11. ニュース要約のための簡易文脈解析

○田中英輝,木下明徳,後藤功雄,熊野正,加藤直人 (NHK放送技術研究所)

ニュース要約に必要な文脈タグの設定、これを使ったコーパス作成、お
よびタグ予測実験の結果について報告する。

[13:15~15:15] ● 多言語処理・質問応答 〔4件〕

12. 統計的特徴を利用した機能語の自動認定実験

○木下 明徳,後藤 功雄,熊野 正,加藤 直人,田中 英輝 (NHK放送技術研究所)

複数言語に対し、言語が持つ共通の特徴を利用して、辞書を使わずに機
能語を認定する実験を行ったので、報告する。

13. 第3言語を介した対訳辞書の自動生成

○玉村真一,Dashtseren Erdenebat,梶博行 (静岡大学)

日英・英中辞書を結合した日中辞書から、日本語・中国語コーパスを用
いて正しい訳語を選別する方法を提案し、実験結果を報告する。

14. A transitive translation for Indonesian-Japanese CLQA

○Ayu Purwarianti,土屋 雅稔,中川 聖一 (豊橋技術科学大学)

インドネシア語-日本語の言語横断質問応答タスクにおいて,中間言語を
使った単語翻訳方式の効果を検討する.

15. 複数のWeb検索エンジンを用いたfactoid型質問応答

○金井明,佐藤充,石下円香,森辰則 (横浜国立大学)

複数のWeb検索エンジンを同時に用いたfactoid型質問応答システムを構
築し,その有効性について調査した。

プログラムの先頭へ戻る。


作成日: 平成19年10月10日
更新日: 平成19年11月15日

◇ 第181回 自然言語処理研究会

◎日時 平成19年9月25日(火)10:30 ~ 18:00
26日(水)10:00 ~ 16:15

◎会場 東京大学 本郷キャンパス 工学部2号館 241講義室
〒113-0033 東京都文京区本郷7-3-1
http://www.u-tokyo.ac.jp/campusmap/map01_02_j.html
http://www.u-tokyo.ac.jp/campusmap/cam01_04_03_j.html

〔交通手段〕
本郷三丁目駅(地下鉄丸の内線)
湯島駅又は根津駅(地下鉄千代田線)
東大前駅(地下鉄南北線)
◎問い合わせ先

  • 研究会・会場に関する問い合わせ先:
    自然言語処理研究会幹事
    二宮 崇(東京大学)
    E-mail: ninomi(at)r.dl.itc.u-tokyo.ac.jp
    Tel: 03-5841-2722

【プログラム】(発表件数20件)

9月25日(火) ― 10:30 ~ 18:00 ―
[10:30~12:00] ● web情報抽出 〔3件〕
[13:30~15:00] ● 機械学習 〔3件〕
[15:15~16:45] ● 対話 〔3件〕
[17:00~18:00] ● 機械翻訳・医療情報 〔2件〕

9月26日(水) ― 10:00 ~ 16:15 ―
[10:00~12:00] ● 評判分析・文脈解析 〔4件〕
[13:30~15:00] ● 語学学習支援・自動校正 〔3件〕
[15:15~16:15] ● 語彙・知識獲得 〔2件〕

※9月25日(火)の御発表のうち,1件が取り消しとなりました.これに伴いまして,
同日午後の最終セッションが3件から2件となり,同日の終了時刻が30分繰り上がりました.

※9月26日(水)の御発表のうち,1件が取り消しとなりました.これに伴いまして,
同日午後の最終セッションが3件から2件となり,同日の終了時刻が30分繰り上がりました.


9月25日(火) ― 10:30 ~ 18:00 ―

[10:30~12:00] ● web情報抽出 〔3件〕

1. スケーラブルで汎用的なブログ著者属性推定手法

○大倉 務, 清水 伸幸, 中川 裕志(東大)

任意の属性に適用可能で、大量のプロフィール付きブログからも学習可能
な、ブログの著者属性を推定する手法を提案する。

2. blogからの比較関係抽出

○佐藤 敏紀, 奥村 学(東工大)

日本語のblogから比較関係({対象, 基準, 属性, 評価}の組)を抽出する。
複数文にまたがる比較表現も対象とする。

3. Web検索結果における人名の曖昧性解消への半教師有りクラスタリングの適用

○杉山一成, 奥村学(東工大)

クラスタの重心の変動を抑制する半教師有りクラスタリングが Web検索結
果における人名の曖昧性解消問題に有効であることを示す。

[13:30~15:00] ● 機械学習 〔3件〕

4. 高次元特徴空間に適した半教師あり条件付確率場の検証

○鈴木 潤, 藤野 昭典, 磯崎 秀樹(NTT コミュニケーション科学基礎研究
所)

主に、エントロピー正則化に基づく半教師あり条件付確率場(Jiao et
al.,ACL-2006)に関して、自然言語処理でしばしば扱われる高次元特徴空
間を用いた系列ラベリングタスクに適用した際の性能と性質に関して報告
する。

5. F値最大化学習に基づく文書の多重ラベリング

○藤野昭典, 磯崎秀樹(NTTコミュニケーション科学基礎研究所)

日本語特許文書のFターム分類のように,1つの文書に多数のラベルを付与
する分類問題に対して,高いF値を与える識別器の設計法を提案する.

6. 高次元圧縮空間の対話的手法による次元縮小

○山崎 啓介, 張 諾, 渡辺 俊典, 古賀 久志(電気通信大学)

テキストマイニングに有用な圧縮率空間の分類能力を保存したまま、その
次元数を縮小する対話的手法を提案する

[15:15~16:45] ● 対話 〔3件〕

7. 発話を行う家具による日常型エンタテインメントシステム

○長谷 将生, 塩入 健太, 星野 准一(筑波大)

日常生活空間の中で自然かつ簡単に体験でき,利用者の行動や天候に対応
した発話や,過去からの繋がりを考慮した発話を出力するシステムの提案.

8. 記憶に基づくゲームキャラクタの発話生成

○濱名 克季, 生野 剛, 星野 准一(筑波大)

キャラクタの知覚情報を「いつ」「どこで」「誰が」「どうした」等の形
で記憶し,それを反映した発話生成の手法を示す.

9. Web情報を用いたキャラクタ間の発話・世間話モデル

○斉藤 哲也, 広田健一, 星野准一(筑波大)

Web上からニュース等のRSS情報を取得し、キャラクタ間に新しい話題を与
え、お互いに世間話をするモデルを構築する。

[17:00~18:00] ● 機械翻訳・医療情報 〔2件〕

10. 英音素変換を用いたカタカナ異表記の自動生成

○服部弘幸, 関和広, 上原邦昭(神戸大)

英語由来のカタカナ語を原言語音素表記に変換、さらに逆変換を施すこと
で 複数の多様なカタカナ異表記を自動生成する手法を提案する。

11. 統計翻訳における木構造制約の導入

○山本 博史, 大熊 英男, 隅田 英一郎(NiCT/ATR)

統計翻訳に対し、シンタックス情報を学習データなしで導入する方法を提
案する。

9月26日(水) ― 10:00 ~ 16:15 ―

[10:00~12:00] ● 評判分析・文脈解析 〔4件〕

12. テキストの話の流れを視覚化するインタフェース–川下りシステム–

○砂山渡(広島市立大)

テキスト中の各単語に、テキストのテーマとの関係を表すラベルを付与し、
各単語のテキスト内でのラベルの変遷を視覚化することで話の流れを表現
する。

13. 因果関係に着目した口コミ情報からの評判情報抽出

○高野 敦子(兵庫大学), 北村 泰彦, 池奥 渉太(関西学院大学)

言明間の因果関係を手がかりとして,種となる評価表現から領域依存の評
価表現を抽出する手法を提案する.

14. 単語出現の意外性に基づく話題性評価方法

○佐藤吉秀, 坂井俊之, 川島晴美, 奥田英範(NTT サイバーソリューショ
ン研究所)

単語の累積出現量を文書到着の度に更新し,最新時刻における各単語の話
題性を高速に評価する方法を提案する.

15. 時事問題に関する賛否両意見の収集

○井上 結衣, 藤井 敦(筑波大)

「赤ちゃんポスト」や「憲法改正」などの時事問題に関する意見を賛否に
分けてWebから収集する手法を提案する.

[13:30~15:00] ● 語学学習支援・自動校正 〔3件〕

16. タスク中心型第二言語学習ゲームの対話生成

○白鳥 和人(筑波大,科学技術振興機構), 張 磊(筑波大), 星野 准
一(筑波大,科学技術振興機構)

言語学習ゲームシステムにおいてプレイヤの英語入力から学習に必要な形
式に沿った応答文を生成する手法を述べる.(53)

17. 文節内の特徴を用いた日本語助詞誤りの自動検出・校正

○南保 亮太, 乙武 北斗, 荒木 健治(北大)

文節内の特徴を用いた助詞選択ルールを入力文に適用し、助詞誤りを検出・
校正するシステムを評価した。

18. コーパスを用いた言語習得度の推定

○坂田浩亮, 新保仁, 松本裕治(奈良先端大)

言語教育において,学習者の習得度を知ることは教師にとって重要である.
本発表では, 習得度別コーパスに基づいて, 言語習得度を推定する手法を
紹介する.

[15:15~16:15] ● 語彙・知識獲得 〔2件〕

19. 能動的質問生成を用いた対話メディアによる知識の獲得および提供

○伊藤 慎吾, 荒木 健治(北大)

WEB上の質問文から学習を行い、能動的にユーザに質問することで知識の
獲得・提供を行うシステムを開発・評価した。

20. 呼応する名詞の包含関係に着目した助数詞オントロジーの自動構築と評価

○白井清昭(北陸先端大), 徳永健伸(東工大)

名詞と助数詞の呼応関係に着目し、助数詞の一般性を反映した助数詞オン
トロジーを自動構築する試みについて述べる。

プログラムの先頭へ戻る。


作成日: 平成19年8月6日
更新日: 平成19年9月4日