speakers

自然言語処理の中長期研究構想を論じる会

speakers

情報処理学会の自然言語処理研究会(NL)では,研究成果の発表・議論が活発に行われています.今後の言語処理研究に革新をもたらすような優れた発表が沢山ありますが,個々の研究は大きなプロジェクトの一部となっていて,短時間での発表では研究の全体像が掴みづらいことがあります.

そこで,第230回研究会は通常とは趣向を変え,「自然言語処理の中長期研究構想を論じる会」と題したシンポジウムとして企画します.本シンポジウムでは,科研,CREST,さきがけ等の国家研究予算,国内研究機関,企業の研究所等で中長期の自然言語処理関連プロジェクトを推進している研究者らに呼びかけ,研究構想や成果の大きな絵を語っていただき,言語処理が今後進むべき方向性について一段高い視点からの議論を狙います.

なお,本シンポジウムはすべて招待講演とし,一般発表の募集はありません.また,動画配信も行いませんので,ぜひ会場までお越しください(事前参加申し込み不要です).

  • 日程: 2017年3月5日(日)
  • 時間: 12:55―17:30
  • 会場: 東京工業大学大岡山キャンパス 東工大蔵前会館 くらまえホール
    〒152-8550 東京都目黒区大岡山2-12-1
    (東急大井町線・目黒線 大岡山駅から徒歩1分)
  • 参加費(情報処理学会の会員種別により異なります):
    • NL研登録会員: 無料
    • ジュニア会員: 無料
    • 学生会員: 500円
    • 名誉会員,正会員,賛助会員: 1,500円
    • 非会員(学生も含む): 2,500円

■ プログラム

12:30 会場

12:55-13:00 開会

13:00-13:40 : データを言語で記述する
高村 大也 先生(東工大)
takamura
スポーツにおける選手やボールの動きそれ自体は時系列三次元座標データにすぎないが、プレイとしての意味が認識され実況者の言葉となり、さらにより深い戦術としての解釈が与えられ解説者の言葉となり、視聴者に伝えられる。スポーツの実況・解説の自動生成は、データを言語で表現するという挑戦的な研究課題の一例であり、データ中のどの部分を表現すべきか、いかに表現すべきかなどの、この研究課題において重要な問題を含んでいる。この講演では、スポーツの実況・解説生成、天気予報コメント生成、市況コメント生成などの例を通して、データを言語で表現するという目標に向けて、現在そしてこれから何をすべきかについて考える。

13:40-14:20 : クロスモーダル表現学習と自然言語処理
中山 英樹 先生(東大)
nakayama
機械学習技術の著しい発展により,自然言語処理や画像認識等の各分野における個別タスクの技術は急速に成熟しつつあり,コモディティ化が進んでいる.一方でそれらの本質的な限界も見え始めており,分野横断的なコラボレーションの上に成り立つ新しい知的情報処理の在り方が強く問われるようになっていると感じる.本講演では,自然言語処理と画像認識を中心に,マルチモーダルデータの横断的な表現学習を活用する研究領域について触れ,その可能性と今後の展望を議論したい.また,講演者が取り組んでいる事例として,画像へのグラウンディングを学習時に利用し,一切のパラレルコーパスなしに機械翻訳システムを構築するゼロショット機械翻訳を紹介する.

14:20-15:00 : ただ機械学習するのはやめませんか
賀沢 秀人 先生(Google)
kazawa
自然言語処理研究の歴史は、内省・観察にもとづく定式化と解法の探求からはじまり、大規模データによる客観評価の時代をへて、機械学習全盛へと至っている。しかし研究成果を利用する立場から見ると、昨今の機械学習を用いた研究には問題が非常に多い。本講演では、自然言語処理システムの開発に携わってきた自身の経験から、現在の機械学習をベースとした研究方法・評価の問題点を指摘し、今後の方向性について幾つか私見を述べる。

15:00-15:20 休憩

15:20-16:00 : 知識に基づく構造的言語処理の確立と知識インフラの構築
黒橋 禎夫 先生(京大)
kurohashi
テキストには,言明内の述語項構造および言明間の談話構造がある.しかし,現状の言語解析で高精度にとらえられるのは一文内の明示された述語項構造のみであり,日本語に頻出する省略された述語項関係や,談話構造の解析は困難である.一方で,近年,ウェブテキストからの基本的な知識の獲得が進展し,大規模な格フレーム,同義表現知識,事態間知識,事実型知識などが利用可能となりつつある.人間の文章の理解を考えれば,人間はその時点ですでに膨大な知識をもっており,その知識に基づいて文章の構造を理解し,そこから(わずかな)新たな知識を得る.このような枠組みを計算機の言語処理においても実現すること,すなわち,すでに獲得した知識を柔軟に利用することにより,文章の解析を高精度化し,これによってテキストの各論述から直接的に言明とその間の因果関係等の知識を抽出することが本研究の中心課題である.これに加えて,その基盤として,言明間あるいは言明と実世界の関係を規定するモダリティ,前提・含意,時制などの意味的関係を正確に捉える意味計算モデルを構築し,その応用として,テキストから直接抽出される知識をテキスト横断的に相互に関連付け,検索・比較・俯瞰を可能とする巨大な知識インフラを構築する.

16:00-16:40 : 対話システム研究の今後の展望–異分野連携による進展を目指して
中野 幹生 先生(HRI-JP)
nakano
対話システムは人間と言語でコミュニケーションを行うシステムであり,入出力のモダリティや対話の種類に応じて様々なタイプのものが研究されている.近年,対話システムの有用性が認知されて来ているが,多くの人に多くの場面で使ってもらえるシステムをリーズナブルなコストで構築するには,まだ多くの課題がある.それらの課題は対話システム・自然言語処理研究者だけでは解決できないため,音声処理,画像処理,HCI,機械学習などの工学のみならず人文科学や社会科学を含めた様々な分野の研究者との連携が不可欠である.そのような連携をスムーズに行うためには,研究ターゲットとして,将来性のある具体的な対話システムのイメージが重要になる.本発表では,対話システム研究の現状を簡潔に述べた後,どのような対話システムがターゲットとしてふさわしいかを議論する.さらに,そのようなシステムを構築するための課題を述べ,異分野連携の進め方について提案する.

16:40-17:20 : 科学技術論文からの知識獲得
松本 裕治 先生(NAIST)
matsumoto
JST CRESTの支援を受けて、2015年10月から5年半の予定で、科学技術文書の解析による文書の柔軟な検索、および、文献の理解に必要な概念や関係に関する知識獲得を支援する統合的なシステム構築を目指すプロジェクトを開始した。専門分野文書の解析のための文書解析技術と言語解析技術、および、文書データからの知識獲得や獲得された知識の提示法などをターゲットとしている。本講演では、プロジェクトの概要、対象としている文書・言語処理タスク、および、問題点を紹介する。

■ 照会先
岡崎直観(東北大学)
E-mail: okazaki (at) ecei.tohoku.ac.jp

★研究会への登録をお勧めします
年に2回以上の参加を見込まれる方は,研究会に登録される方が(ほぼ)お得になります.研究会登録は情報処理学会のウェブサイトから行えます.

■ 研究会幹事団
主査:

  • 乾健太郎 (東北大学)

幹事:

  • 荒瀬由紀 (大阪大学)
  • 岡崎直観 (東北大学)
  • 木村俊也 (株式会社ミクシィ)
  • 小町守  (首都大学東京)
  • 西川仁  (東京工業大学)

運営委員:

  • 浅原正幸 (国立国語研究所)
  • 荒牧英治 (奈良先端科学技術大学院大学)
  • 石野亜耶 (広島経済大学)
  • 金丸敏幸 (京都大学)
  • 小林隼人 (Yahoo! JAPAN 研究所)
  • 古宮嘉那子(茨城大学)
  • 貞光九月 (日本電信電話株式会社)
  • 佐藤敏紀 (LINE株式会社)
  • 新里圭司 (株式会社楽天)
  • 鈴木祥子 (日本アイ・ビー・エム株式会社)
  • 数原良彦 (リクルートホールディングス)
  • 高村大也 (東京工業大学)
  • 土田正明 (日本電気株式会社)
  • 堂坂浩二 (秋田県立大学)
  • 徳永拓之 (スマートニュース株式会社)
  • 二宮崇  (愛媛大学)
  • 橋本力  (独立行政法人 情報通信機構)
  • 藤田早苗 (日本電信電話株式会社)
  • 牧野貴樹 (グーグル株式会社)
  • 牧野拓哉 (株式会社富士通研究所)
  • 松崎拓也 (名古屋大学)
  • ミハウ・プタシンスキ(北見工業大学)
  • 村脇有吾 (京都大学)
  • 若木裕美 (株式会社東芝)
  • Kevin Duh (Johns Hopkins University)

第229回自然言語処理研究会 参加募集

12月21日および22日にNTT武蔵野研究開発センタにおいて第3回自然言語処理シンポジウムを開催します.
本シンポジウムは電子情報通信学会NLC研究会および情報処理学会NL研究会による合同研究会です.
自然言語処理シンポジウムでは,一般発表およびポスター発表の他にも早稲田大学の酒井先生の招待講演やEMNLP2016およびCOLING2016の参加報告もあります.
また,12月20日には同会場でSP研究会およびSLP研究会による音声言語シンポジウムも開催されています.
皆様の多数のご参加を心よりお待ちしております.

【関連イベント1】
12月20日(火)の18時からNTT研究所のラボツアーを実施します.
参加には事前登録が必要です.
以下のフォームから参加登録をお願いします.
https://goo.gl/WWKk2t

【関連イベント2】
12月22日(木)の13時からNTT技術資料館のツアーを実施します.
参加には事前登録が必要です.
以下のフォームから参加登録をお願いします.
https://goo.gl/1ckh9i

−−−−−−−−−−−−−−
第3回自然言語処理シンポジウム:参加募集

日時
2016年12月21日(水) 13:00 – 17:55
2016年12月22日(木)  9:30 – 17:45

場所
NTT武蔵野研究開発センタ 本館 コンベンションホール
〒180-8585 東京都武蔵野市緑町3-9-11
http://www.ntt.co.jp/RD/contactus/map_musashino.html

※2月20日(火)および21日(水)の午前まで「第18回音声言語シンポジウム」も開催されています.
第18回音声言語シンポジウムでは,一般・ポスター発表(25件)に加えて,以下のような招待講演も予定されています.
12月20日(火)
13:10 – 14:10 複数マイクロフォンを用いた音声認識 – 遠隔発話音声認識の研究動向
渡部晋治 (Mitsubishi Electric Research Laboratories)
14:10 – 15:10 Discrete I-vector Representations for Modeling DNN Hidden Layer Posteriors
Najim Dehak (Johns Hopkins University)

12月21日(水)
10:45 – 11:45 [招待講演]音声研究と自然言語研究の融合に向けて 〜 音声翻訳研究の過去と未来 〜
中村 哲(奈良先端大)

全体のプログラムは以下のURLにより,ご確認ください.
http://www.ieice.org/ken/program/index.php?mode=program&tgs_regid=8b0770315a9248624e81b13c33dc444149a807004aa9a7610d9980b0bf3a2129&tgid=IEICE-NLC&layout=html1&lang=

12月21日(水) オープニング (13:00〜13:15)
オープニング・ポスター発表の概要説明
※オープニングに引き続き,各ポスター発表の内容紹介を実施します(1件あたり60秒)

12月21日(水) 午後 ポスターセッション (13:15〜14:45)
(1) [NLC] Kyutechコーパスにおける発話意図タグの設計と分析
○日野優登・山村 崇・嶋田和孝(九工大)

(2) [NLC] ゲーミフィケーションを利用した効率的な対話ログ収集の試み
○叶内 晨・小町 守(首都大東京)

(3) [NLC] 複数の作業者グループを用いた対話における言外の情報の類型化
○光田 航・東中竜一郎・松尾義博(NTT)

(4) [NL] 音声対話システムによる精神疾患自動評価
○横谷謙次(新潟青陵大)

(5) [NL] 雑談対話システムの話題遷移における自然性の自動評価
○豊嶋章宏(NAIST)・杉山弘晃(NTT)・吉野幸一郎・中村 哲(NAIST)

(6) [NL] 同時音声翻訳のための構文情報を用いた文分割に基づく機械翻訳
○帖佐克己(阪府大/NAIST)・小田悠介・Sakriani Sakti・吉野幸一郎・中村 哲(NAIST)

(7) [NL] 空間配置課題における命令表現の解析
○後藤大希・西川 仁・徳永健伸(東工大)

(8) [NL] 視線情報を用いた日本語述語項構造解析モデルのパラメータ推定
○牧 諒亮・西川 仁・徳永健伸(東工大)

12月21日(水) 午後 国際会議報告 (14:45〜16:05)

(9) [NLC] 14:45 – 15:05
[依頼講演]国際会議 EMNLP 2016 参加報告 (1)
○若林 啓(筑波大)

(10) [NLC] 15:05 – 15:25
[依頼講演]国際会議 EMNLP 2016 参加報告 (2)
○高瀬 翔(東北大)

(11) [NLC] 15:25 – 15:45
[依頼講演]国際会議 COLING2016 参加報告 (1)
○鈴木祥子(TRL)

(12) [NLC] 15:45 – 16:05
[依頼講演]国際会議 COLING2016 参加報告 (2)
○若宮翔子(奈良先端大)

−−− 休憩 ( 20分 ) −−−

12月21日(水) 午後 口頭発表:言語資源の構築と利用 (16:25〜17:55)

(13) [NL] 16:25 – 16:55
平易なコーパスを用いないテキスト平易化のための単言語パラレルコーパスの構築
○梶原智之・小町 守(首都大)

(14) [NL] 16:55 – 17:25
日本語Wikificationコーパスを用いたアンカー抽出性能評価に関する検討
○小谷亮太・綱川隆司・西田昌史・西村雅史(静岡大)

(15) [NL] 17:25 – 17:55
単語分かち書き用辞書生成システム NEologd の運用 — 文書分類を例にして —
○佐藤敏紀・橋本泰一(LINE)・奥村 学(東工大)

12月22日(木) 午前 口頭発表:言語処理応用 (09:30〜10:30)

(16) [NLC] 09:30 – 10:00
人工知能を利用した短答式記述採点支援システム
○石岡恒憲・亀田雅之(大学入試センター)・劉 東岳(学研教育総研)

(17) [NLC] 10:00 – 10:30
分類器による顔文字の原形推定
○奥村紀之(明石高専)

−−− 休憩 ( 15分 ) −−−

12月22日(木) 午前 招待講演 (10:45〜11:45)

(18) 10:45 – 11:45
招待講演:評価実験の設計と論文での結果報告: きちんとやっていますか?
○酒井哲也(早大)

−−− 昼食 ( 75分 ) −−−

−−− NTT技術資料館のツアー ( 60分 ) −−−

12月22日(木) 午後 口頭発表:分散表現と深層学習 (14:00〜15:30)

(19) [NL] 14:00 – 14:30
表形式からの分散表現獲得
○吉田 稔・松本和幸・北 研二(徳島大)

(20) [NL] 14:30 – 15:00
単語分散表現を用いた単語アライメントによる日英機械翻訳の自動評価尺度
○松尾潤樹・小町 守(首都大)・須藤克仁(NTT)

(21) [NL] 15:00 – 15:30
深層リカレントニューラルネットワークを用いた日本語述語項構造解析
○大内啓樹・進藤裕之・松本裕治(NAIST)

−−− 休憩 ( 15分 ) −−−

12月22日(木) 午後 口頭発表:言語解析・文脈処理 (15:45〜17:45)

(22) [NL] 15:45 – 16:15
係り受け構造を用いたWeb議論掲示板における投稿への自動ラベリング
○岩佐幸翠・藤田桂英(農工大)

(23) [NL] 16:15 – 16:45
複単語表現を考慮した英語の依存構造解析モデリング
○加藤明彦・進藤裕之・松本裕治(NAIST)

(24) [NLC] 16:45 – 17:15
単語対応を利用した欠落語の投射による機械翻訳向きオラクル入力文の生成
○竹野峻輔(長岡技科大)・永田昌明(NTT)・山本和英(長岡技科大)

(25) [NLC] 17:15 – 17:45
Dynamic Social Choice for Pronominal Reference
○Sumiyo Nishiguchi(TUS)

−−− クロージング ( 10分 ) −−−

今後の予定
■NLC研究会:2月9日(木)・10日(金),第10回テキストマイニングシンポジウム(大阪)

■NL研究会:3月5日 (日) 第230回自然言語処理研究会(東京)

■NLC研究会幹事団
専門委員長 金山 博 (日本IBM)
副委員長 市瀬 眞 (NTTドコモ), 榊 剛史 (東大/ホットリンク)
幹事 渡辺 靖彦 (龍谷大), 嶋田 和孝 (九工大)
幹事補佐 東中 竜一郎 (NTT), 吉田 光男 (豊橋技科大)

■NL研究会幹事団
主査 乾 健太郎 (東北大)
幹事 荒瀬 由紀 (大阪大), 岡崎 直観 (東北大), 木村 俊也 (ミクシィ),
小町 守 (首都大学東京), 西川 仁 (東工大)

◇ 第162回 自然言語処理研究会

◎日 時 平成16年7月15日(木) 10:00 ~ 17:30
16日(金)  9:00 ~ 17:30

◎会 場 北海学園大学(山鼻キャンパス) 3号館1階
〒064-0926 札幌市中央区南26条西11丁目1-1

  • [交通手段]
  • バス(定鉄バス)
    訂正) 本年4月より、ご来校される際に利用できるバスの「市営バス」は全て「定鉄バス」に変わりました。ただし、路線自体の変更はございません。
    • JR札幌駅から「南54真駒内線」「南55藻岩線」あるいは地下鉄東西線西11丁目駅から「南4・南54・南64真駒内線」より乗車(所要時間それぞれ約20分、約15分)、バス停「南27西11」下車、徒歩約3分
    • 札幌駅バスターミナルから「定山渓線」より乗車(所要時間約20分)、バス停「南27西11」下車、徒歩約3分

    定鉄バスのホームページ

  • タクシー
    JR札幌駅前から「北海学園大学工学部(石山通り沿い南26条)」まで(所要時間約15分)北海学園大学山鼻キャンパスの近隣地図

◎問い合わせ先

  • 研究会に関すること
    内元清貴(情報通信研究機構)
    Tel: (0774)98-6834, Fax: (0774)98-6961
  • 会場に関すること
    越前谷博(北海学園大学)
    Tel: 011-841-1161 (Ext.7863), Fax: 011-551-2951

【プログラム】(発表件数30件)

7月15日(木) ― 10:00 ~ 17:30 ―
 [10:00 ~ 12:05] ● 意味表現・データマイニング   〔5件〕
 [13:30 ~ 15:35] ● 情報抽出・翻訳知識獲得     〔5件〕
 [15:50 ~ 17:30] ● 機械翻訳            〔4件〕
7月16日(金) ― 09:00 ~ 17:30 ―
 [09:00 ~ 10:40] ● 語彙的知識獲得         〔4件〕
 [10:55 ~ 12:10] ● 質問応答            〔3件〕
 [13:30 ~ 15:10] ● セグメンテーション・要約    〔4件〕
 [15:25 ~ 17:30] ● 仮名漢字変換・形態素構文解析  〔5件〕


7月15日(木) ― 10:00 ~ 17:30 ―

[10:00 ~ 12:05] ● 意味表現・データマイニング    〔5件〕

  1. 暦に基づく時間指示表現に対する意味表現形式の提案
      ○溝渕昭二(近畿大学), 安藤一秋(香川大学)

  本稿では,暦に基づく時間指示表現を対象として,その意味を記述
  するための表現形式である時間指示式を提案する.

  1. クエリー駆動方式の文書間極大類比構築法
      ○原口誠, 吉岡真治(北海道大学)

  物語データベース構築のために提案した、共通抽象イベント列構築
  手法の高速化について報告する。

  1. Rethinking Plans and Scripts Realization in the Age of Web-mining
      ○ジェプカ・ラファウ, 伊藤敏彦, 荒木健治(北海道大学)

  New ideas for applications using cognitive science concepts
  which realizing before was impossible due to the technical
  limits.

  1. テキストデータを用いた問題の早期発見手法
      ○宅間大介, 野美山浩(日本IBM)

  非定常な問題を発見するための領域知識の構造化,テキストとの対
  応付け,及び時系列解析の手法を提案する.

  1. 文献からの薬物相互作用情報の抽出に向けて
      ○保坂順子, 吉川澄美, 松村和美, 小長谷明彦(理化学研究所)

  われわれは、構文解析に基づく情報抽出を行っている。”
  metabolize/metabolism”な どの生物文献固有の作用語に着目した
  抽出規則の作成を行っているので、その現状を報告する。

[13:30 ~ 15:35] ● 情報抽出・翻訳知識獲得      〔5件〕

  1. Webページ内の目的部分の自動抽出
      ○新納浩幸, 佐々木稔(茨城大学)

  テキストブラウザを利用してテキスト化し、各行に対する START/
  END 法を行なうことで所望の部分を抽出する。対訳コーパスの自動
  作成に応用する。

  1. メタデータ付与のための住所録自動生成
      ○村山紀文, 南野朋之, 奥村学(東京工業大学)

  固有名に住所情報などを付与するための住所録を、Web上のデータ
  から情報抽出することで自動生成する。

  1. 隣接情報に基づく対訳語の自動抽出手法
      ○越前谷博(北海学園大学), 荒木健治(北海道大学), 桃内佳雄(北海学園大学)

  対訳コーパスから対訳語を抽出する際、対訳語に隣接する単語列を
  利用する手法を提案する。Dice係数に本手法を導入した結果、抽出
  率が向上し、本手法の有効性を確認した。

  1. 日英報道記事からの訳語対応推定: ターム頻度と訳語対応推定性能の相関の評価
      ○日野浩平(豊橋技科大), 宇津呂武仁(京都大学), 中川聖一(豊橋技科大)

  日英報道記事からの訳語対応推定において,ターム頻度が大きいほ
  ど高い 訳語対応推定性能が得られることを実験的に示す.

  1. 日英二言語文書を用いた訳語対応推定: ウェブ上の非対訳文書を用いた訳語候補順位付け
      ○木田充洋, 宇津呂武仁(京都大学), 日野浩平(豊橋技科大), 佐藤理史(京都大学)

  あらかじめ用意された英日の訳語組候補について,ウェブ上の検索
  エンジンにより収集した各言語の(非対訳)文書を用いて,訳語候補
  の順位付けを行なう.

[15:50 ~ 17:30] ● 機械翻訳             〔4件〕

  1. 統計翻訳指標を導入した構文トランスファに基づく用例翻訳
      ○今村賢治, 大熊英男, 渡辺太郎, 隅田英一郎(ATR)

  統計翻訳のモデルを利用して最適訳選択を行う、構文トランスファ
  方式の用例翻訳器を提案する。

  1. アイヌ語名詞句の日本語への漸進的直接翻訳について
      ○桃内佳雄(北海学園大学)

  アイヌ語名詞句の構造とアイヌ語の特徴的な文法機能に依存した漸
  進的直接翻訳の可能性について考察する.

  1. 音韻論的・形態論的制約を用いたモンゴル語句生成
      ○Sanduijav ENKHBAYAR, 宇津呂武仁, 佐藤理史(京都大学)

  少数のモンゴル語句生成規則により句候補を生成し,モンゴル語コ
  ーパス中の事例を検索することにより,句候補の絞り込みを行なう.

  1. 翻訳検証テストのためのストリングリソースID
      ○加藤直孝(日本IBM), 有澤誠(慶應大)

  外部化したストリングリソースすべてにIDを振ることにより、GUI
  上に出力するストリングの出所を明確にする方法を開発し実用化し
  た。

7月16日(金) ―  09:00 ~ 17:30 ―

[09:00 ~ 10:40] ● 語彙的知識獲得          〔4件〕

  1. 慣用句抽出のための統計尺度の比較評価
      ○相薗敏子, 小泉敦子, 森本康嗣(日立製作所)

  複数の統計尺度を用いて文書DBから抽出した文節のペアを順位付
  けし、慣用句抽出という観点から比較・評価した。

  1. 文脈一貫性を利用した極性付評価表現の語彙獲得
      ○那須川哲哉, 金山博(日本IBM)

  組織・製品などに関して好不評を示す表現を、「満足する」「不満
  だ」などの種表現との隣接共起性から、教師なし学習で獲得する手
  法を示す。

  1. 複数の著者の表記の違いを利用した同義表現抽出
      ○村上明子, 那須川哲哉(日本IBM)

  自然言語理解において同義表現の解決が重要 である事を示し、筆
  者による表記の統一性を 利用した同義表現の抽出法を提案する。

  1. Katakana Variants Detection for Information Retrieval
      ○曲衛東, 白井克彦(早稲田大学)

  Word mismatch is a major issue in information retrieval
  task. Traditionally, automatic query feedback or thesaurus
  is used to deal with this problem. However in Japanese
  information retrieval, there is a special case, Katakana
  Variants, which cannot be solved by using query feedback. It
  also cannot be solved completely by using thesaurus since no
  thesaurus contains all possible Katakana Variants. Most of
  works to deal with this problem is based on rewrite rules.
  In this paper we present a knowledge-free method to deal
  with this question. We use orthographic cues and weighted
  semantic similarity to detect the Katakana Variants. Our
  preliminary experiments show the proposed method is useful
  for Katakana Variants detection.

[10:55 ~ 12:10] ● 質問応答             〔3件〕

  1. メーリングリストを利用した質問応答システムのための知識獲得
      ○渡辺靖彦, 園和也, 岡田至弘(龍谷大学)

  メーリングリストに投稿された質問および回答のメールから重要文
  を取り出し、 それらが質問応答システムの知識として役立つこと
  を示す。

  1. New Features for the Question Classification Using Support Vector Machines
      ○Marcin Skowron, Kenji Araki(北海道大学)

  Question Classification is of crucial importance for
  question answering. Support Vector Machines are known to
  work well for sparse, high dimensional problems. However,
  the frequently used bag-of-words approach does not take the
  full advantage of information contained in a question. To
  capture this information we propose three new features:
  subordinate word category, question focus and
  syntactic-semantic structure. As our evaluation shows the
  inclusion of these new features provides higher accuracy of
  question classification, comparing to the classical
  bag-of-words approach and other methods that were described
  in the literature so far.

  1. 質問応答技術は情報アクセス対話を実現できるか
      ○加藤恒昭(東京大学), 福本淳一(立命館大学), 桝井文人(三重大学),
      神門典子(国立情報学研究所)

  対話的情報収集場面で必要となる質問応答技術の能力に関する
  調査結果とその能力を評価するためのタスクの設計を述べる.

[13:30 ~ 15:10] ● セグメンテーション・要約     〔4件〕

  1. 単語の結束度と文の表層情報を組み合わせたテキストセグメンテーション
      ○松井祥峰, 乾伸雄, 小谷善行(東京農工大学)

  従来の手法を組み合わせる方法を提案し、セグメント境界を推定す
  る精度が向上することを実験的に評価する。

  1. 表層表現に基づく重要段落抽出
      ○中野滋徳, 足立顕(富士通), 牧野武則(東邦大学)

  提題と文の連接関係を解析することで文をセグメンテーションする
  手法について述べる

  1. 複数の質問に焦点を当てた複数文書要約手法
      ○森辰則, 野澤正憲, 浅田義昭(横浜国大)

  質問応答エンジンを用いることで、複数文書から、利用者の持つ複
  数の情報要求を満足する要約を生成する手法について述べる。

  1. 文書要約の自動評価法の提案と評価
      ○平尾努(NTT), 奥村学(東京工業大学), 磯崎秀樹, 前田英作(NTT)

  文書の要約結果を自動評価する手法を新たに提案し、従来より提案
  されている自動評価法(ROUGE)との比較を行う。

[15:25 ~ 17:30] ● 仮名漢字変換・形態素構文解析   〔5件〕

  1. 生コーパスからの単語 N-gram 確率の推定
      ○森信介, 宅間大介(日本IBM)

  生コーパスから単語n-gram確率を推定する方法を提案し、 その効
  果を仮名漢字変換を題材として実験的に示す。

  1. シソーラスを用いた派生語の仮名漢字変換の特性
      ○市丸夏樹(九州大学), 中村貞吾(九州工業大学), 日高達(九州大学名誉教授)

  用例とシソーラスを組み込んだPCFGによる派生語の仮名漢字変換に
  おいて, 95%の正解率を得たので報告する.

  1. 単語レベルと文字レベルの情報を用いた中国語・日本語単語分割
      ○中川哲治(沖電気工業), 松本裕治(奈良先端大)

  コスト最小法と文字タグ付け法を組み合わせることにより,高い精
  度で未知語の解析を行う単語分割手法を提案する.

  1. 相対的な係りやすさを考慮した日本語係り受け解析モデル
      ○工藤拓, 松本裕治(奈良先端大)

  従来の統計的係り受け解析の多くは、他の係り先候補とは独立に
  算出される絶対的な係りやすさに基づきモデル化されていた。 本
  発表では、他の候補との係りやすさを相対的に比較するモデル を
  提案し、実データを用いて有効性を検証する。

  1. 節境界に基づく独話文係り受け解析の効率化
      ○大野誠寛, 松原茂樹(名古屋大学), 丸山岳彦(国立国語研究所),
    柏岡秀紀(ATR), 田中英輝(NHK), 稲垣康善(愛知県立大学)

  独話文の係り受け解析を節分割により高速化する手法を提案する.
  本手法では、節レベルと文レベルの二段階で解析を実行する.

プログラムの先頭へ戻る。


作成日:平成16年5月17日