情報処理学会の自然言語処理研究会(NL)では,研究成果の発表・議論が活発に行われています.今後の言語処理研究に革新をもたらすような優れた発表が沢山ありますが,個々の研究は大きなプロジェクトの一部となっていて,短時間での発表では研究の全体像が掴みづらいことがあります.
そこで,第230回研究会は通常とは趣向を変え,「自然言語処理の中長期研究構想を論じる会」と題したシンポジウムとして企画します.本シンポジウムでは,科研,CREST,さきがけ等の国家研究予算,国内研究機関,企業の研究所等で中長期の自然言語処理関連プロジェクトを推進している研究者らに呼びかけ,研究構想や成果の大きな絵を語っていただき,言語処理が今後進むべき方向性について一段高い視点からの議論を狙います.
なお,本シンポジウムはすべて招待講演とし,一般発表の募集はありません.また,動画配信も行いませんので,ぜひ会場までお越しください(事前参加申し込み不要です).
- 日程: 2017年3月5日(日)
- 時間: 12:55―17:30
- 会場: 東京工業大学大岡山キャンパス 東工大蔵前会館 くらまえホール
〒152-8550 東京都目黒区大岡山2-12-1
(東急大井町線・目黒線 大岡山駅から徒歩1分) - 参加費(情報処理学会の会員種別により異なります):
- NL研登録会員: 無料
- ジュニア会員: 無料
- 学生会員: 500円
- 名誉会員,正会員,賛助会員: 1,500円
- 非会員(学生も含む): 2,500円
■ プログラム
12:30 会場
12:55-13:00 開会
13:00-13:40 : データを言語で記述する
高村 大也 先生(東工大)
スポーツにおける選手やボールの動きそれ自体は時系列三次元座標データにすぎないが、プレイとしての意味が認識され実況者の言葉となり、さらにより深い戦術としての解釈が与えられ解説者の言葉となり、視聴者に伝えられる。スポーツの実況・解説の自動生成は、データを言語で表現するという挑戦的な研究課題の一例であり、データ中のどの部分を表現すべきか、いかに表現すべきかなどの、この研究課題において重要な問題を含んでいる。この講演では、スポーツの実況・解説生成、天気予報コメント生成、市況コメント生成などの例を通して、データを言語で表現するという目標に向けて、現在そしてこれから何をすべきかについて考える。
13:40-14:20 : クロスモーダル表現学習と自然言語処理
中山 英樹 先生(東大)
機械学習技術の著しい発展により,自然言語処理や画像認識等の各分野における個別タスクの技術は急速に成熟しつつあり,コモディティ化が進んでいる.一方でそれらの本質的な限界も見え始めており,分野横断的なコラボレーションの上に成り立つ新しい知的情報処理の在り方が強く問われるようになっていると感じる.本講演では,自然言語処理と画像認識を中心に,マルチモーダルデータの横断的な表現学習を活用する研究領域について触れ,その可能性と今後の展望を議論したい.また,講演者が取り組んでいる事例として,画像へのグラウンディングを学習時に利用し,一切のパラレルコーパスなしに機械翻訳システムを構築するゼロショット機械翻訳を紹介する.
14:20-15:00 : ただ機械学習するのはやめませんか
賀沢 秀人 先生(Google)
自然言語処理研究の歴史は、内省・観察にもとづく定式化と解法の探求からはじまり、大規模データによる客観評価の時代をへて、機械学習全盛へと至っている。しかし研究成果を利用する立場から見ると、昨今の機械学習を用いた研究には問題が非常に多い。本講演では、自然言語処理システムの開発に携わってきた自身の経験から、現在の機械学習をベースとした研究方法・評価の問題点を指摘し、今後の方向性について幾つか私見を述べる。
15:00-15:20 休憩
15:20-16:00 : 知識に基づく構造的言語処理の確立と知識インフラの構築
黒橋 禎夫 先生(京大)
テキストには,言明内の述語項構造および言明間の談話構造がある.しかし,現状の言語解析で高精度にとらえられるのは一文内の明示された述語項構造のみであり,日本語に頻出する省略された述語項関係や,談話構造の解析は困難である.一方で,近年,ウェブテキストからの基本的な知識の獲得が進展し,大規模な格フレーム,同義表現知識,事態間知識,事実型知識などが利用可能となりつつある.人間の文章の理解を考えれば,人間はその時点ですでに膨大な知識をもっており,その知識に基づいて文章の構造を理解し,そこから(わずかな)新たな知識を得る.このような枠組みを計算機の言語処理においても実現すること,すなわち,すでに獲得した知識を柔軟に利用することにより,文章の解析を高精度化し,これによってテキストの各論述から直接的に言明とその間の因果関係等の知識を抽出することが本研究の中心課題である.これに加えて,その基盤として,言明間あるいは言明と実世界の関係を規定するモダリティ,前提・含意,時制などの意味的関係を正確に捉える意味計算モデルを構築し,その応用として,テキストから直接抽出される知識をテキスト横断的に相互に関連付け,検索・比較・俯瞰を可能とする巨大な知識インフラを構築する.
16:00-16:40 : 対話システム研究の今後の展望–異分野連携による進展を目指して
中野 幹生 先生(HRI-JP)
対話システムは人間と言語でコミュニケーションを行うシステムであり,入出力のモダリティや対話の種類に応じて様々なタイプのものが研究されている.近年,対話システムの有用性が認知されて来ているが,多くの人に多くの場面で使ってもらえるシステムをリーズナブルなコストで構築するには,まだ多くの課題がある.それらの課題は対話システム・自然言語処理研究者だけでは解決できないため,音声処理,画像処理,HCI,機械学習などの工学のみならず人文科学や社会科学を含めた様々な分野の研究者との連携が不可欠である.そのような連携をスムーズに行うためには,研究ターゲットとして,将来性のある具体的な対話システムのイメージが重要になる.本発表では,対話システム研究の現状を簡潔に述べた後,どのような対話システムがターゲットとしてふさわしいかを議論する.さらに,そのようなシステムを構築するための課題を述べ,異分野連携の進め方について提案する.
16:40-17:20 : 科学技術論文からの知識獲得
松本 裕治 先生(NAIST)
JST CRESTの支援を受けて、2015年10月から5年半の予定で、科学技術文書の解析による文書の柔軟な検索、および、文献の理解に必要な概念や関係に関する知識獲得を支援する統合的なシステム構築を目指すプロジェクトを開始した。専門分野文書の解析のための文書解析技術と言語解析技術、および、文書データからの知識獲得や獲得された知識の提示法などをターゲットとしている。本講演では、プロジェクトの概要、対象としている文書・言語処理タスク、および、問題点を紹介する。
■ 照会先
岡崎直観(東北大学)
E-mail: okazaki (at) ecei.tohoku.ac.jp
★研究会への登録をお勧めします
年に2回以上の参加を見込まれる方は,研究会に登録される方が(ほぼ)お得になります.研究会登録は情報処理学会のウェブサイトから行えます.
■ 研究会幹事団
主査:
- 乾健太郎 (東北大学)
幹事:
- 荒瀬由紀 (大阪大学)
- 岡崎直観 (東北大学)
- 木村俊也 (株式会社ミクシィ)
- 小町守 (首都大学東京)
- 西川仁 (東京工業大学)
運営委員:
- 浅原正幸 (国立国語研究所)
- 荒牧英治 (奈良先端科学技術大学院大学)
- 石野亜耶 (広島経済大学)
- 金丸敏幸 (京都大学)
- 小林隼人 (Yahoo! JAPAN 研究所)
- 古宮嘉那子(茨城大学)
- 貞光九月 (日本電信電話株式会社)
- 佐藤敏紀 (LINE株式会社)
- 新里圭司 (株式会社楽天)
- 鈴木祥子 (日本アイ・ビー・エム株式会社)
- 数原良彦 (リクルートホールディングス)
- 高村大也 (東京工業大学)
- 土田正明 (日本電気株式会社)
- 堂坂浩二 (秋田県立大学)
- 徳永拓之 (スマートニュース株式会社)
- 二宮崇 (愛媛大学)
- 橋本力 (独立行政法人 情報通信機構)
- 藤田早苗 (日本電信電話株式会社)
- 牧野貴樹 (グーグル株式会社)
- 牧野拓哉 (株式会社富士通研究所)
- 松崎拓也 (名古屋大学)
- ミハウ・プタシンスキ(北見工業大学)
- 村脇有吾 (京都大学)
- 若木裕美 (株式会社東芝)
- Kevin Duh (Johns Hopkins University)