第237回自然言語処理研究会 参加募集

情報処理学会 第237回自然言語処理研究会 参加募集
https://nl-ipsj.or.jp

●日程: 2018年9月25日 (火)・26日 (水)
●会場: 北見工業大学 A106講義室 (1号館1階)
アクセス・キャンパスマップ:
http://www.kitami-it.ac.jp/about/access/

●動画中継
今回の研究会では,インターネットを利用した研究発表の動画中継を予定
しております.基本的にすべての発表を動画中継の対象とする予定ですが,
発表者の希望により対象から外すことも出来ますので,研究発表の当日に
その旨お伝えください.動画中継の詳細については,追ってアナウンス
いたします.

●懇親会
9月25日(火)に北見駅周辺にて懇親会を(参加費別途)予定しております.
参加人数把握の都合上,参加をご希望の方は 9月14日(金)までに下記
フォームにご回答下さい.
https://goo.gl/forms/au0HMYRzU1lfVm683

●併設イベント:
9月27日の午前に「カーリング体験会」を開催する予定ですので,奮って
ご参加下さい.
日程: 2018年9月27日 (木) 午前
会場: アドヴィックス常呂カーリングホール
http://www.okhotsk-sports-camp.jp/facility/detail.php?fcid=21
参加費:1,500円程度を予定
備考: 送迎バスを準備します.9:00 北見駅付近発〜13:00北見駅付近着
復路は女満別空港を経由します.
講師は平昌オリンピック男子代表メンバ平田洸介選手を予定しています.
– 参加ご希望の方は,以下よりお申し込み下さい.
https://goo.gl/forms/BCNiSYUPFofpwja73

●問い合わせ先:
桝井文人,プタシンスキ・ミハウ(北見工業大学)
E-mail: staff (at) mail.kitami-it.ac.jp

===============================================
プログラム
9月25日(火) 13:00-16:45 (3件+招待講演1件)
[13:00-13:15] オープニング
[13:15-14:15] 招待講演 (1件)
[14:15-14:30] 休憩
[14:30-16:00] 言語処理応用 (3件)
[18:00- ] 懇親会

9月26日(水) 10:45-16:00 (5件)
[10:45-12:15] 情報抽出・知識獲得 (3件)
[12:15-14:00] 昼休み
[14:00-15:00] 深層学習 (2件)
[15:00-15:15] クロージング

9月27日(木)9:00-13:00 カーリング体験会

9月25日(火)13:00-16:00 (3件+招待講演1件)

[13:00-13:15] オープニング

[13:15-14:15] 招待講演 (1件)
(01)
オノマトペから見る言葉のあいまいさ
内田ゆず(北海学園大学)

日本語オノマトペは,現実世界の様々な事象を表現して微妙なニュアンスを
伝える際に役立つ柔軟な言葉である.また,多義性が高い,品詞が一意に
定まらないなどの特徴から,日本語表現の中でもとりわけ曖昧な語群として
知られる.さらに,新語や新用法が生まれやすいという特徴も相まって,
オノマトペは計算機での処理が難しい.本講演では,オノマトペの工学的
応用を目的として進めている分析結果について実例を交えて紹介し,言葉が
もつ曖昧さを計算機上で扱う方法を考える.

[14:15-14:30] 休憩

[14:30-16:00] 言語処理応用 (3件)
(02)
A proposal for a unified corpus of the Ainu language
Nowakowski Karol, Ptaszynski Michal, 桝井文人(北見工大)

Ainu is an endangered language spoken in northern Japan. It has been the
subject of many studies, but most scholars work on small amounts of language
data. Also, there is no general agreement on such matters as word classes
existing in Ainu, thus various conventions for linguistic description are used. To
address that problem, we propose a corpus of Ainu covering a wide range of
documents, in a consistent structure that will enable large-scale linguistic
analysis and support the development of NLP technologies for Ainu,
contributing to the process of its revitalization. The corpus contains parallel text
in Ainu and Japanese. Its subset includes POS annotations produced by expert
linguists. For the remaining part, annotations will be generated automatically. At
present, resources collected for the corpus comprise 2M characters (428K tokens)
of text in Ainu. Their utility for NLP applications has been verified by applying
them in a tokenization system, which achieved F-score! above 95%.

(03)
Wikipedia から獲得した外部知識を用いた賛否分類
塙 一晃(東北大),佐々木 彬(リクルートテクノロジーズ),岡崎 直観(東京工大),
乾 健太郎(東北大/理研AIP)

本研究では賛否分類においてトピックに関する外部知識を利用するための手法
を提案する.Wikipedia 記事に紐づいた7トピックに関する 6,701 件のツイート
からなるデータセットを作成し,分析することで賛否分類における外部知識の
必要性が明らかとなった.また,本研究では Wikipedia 記事から獲得した知識
を賛否分類で利用するために,関連する知識を参照しながら文をエンコード
することができるモデルを提案する.Wikipedia から獲得した知識を使用する
提案手法は外部知識を使用しないものよりも高い精度で賛否の予測ができる
ことが実験結果より明らかとなった.

(04)
Androidアプリのレビューを用いたユーザーへの権限説明の補完
小島 智樹,酒井 哲也(早稲田大)

現代では、多くの人がスマートフォンを使用している。そして、それに対応
する多くのアプリケーションが公式のストアである GooglePlay などで配布
されている。アプリケーションをダウンロードするとき、ユーザは権限を求め
られる。権限とは端末のセンシティブな情報にアクセスする許可のことである。
権限はときに悪用されるため、ユーザーは権限の要求の理由がわからず、不安
を覚えることがある。本論文ではアプリケーションの権限と説明文、及び
レビューを利用し、権限の説明を補完することで不安の軽減を行う手法に
ついて提案する。

[18:00- ] 懇親会

9月26日(水)10:45-15:15 (5件)

[10:45-12:15] 情報抽出・知識獲得 (2件)
(05)
音声対話システムに向け意味属性抽出と意図タイプ推定実装小型化
米持 幸寿(ホンダ・リサーチ・インスティチュート・ジャパン)

音声対話システムの構築において, 自然言語理解 (Natural Language Under-
standing: NLU)のための固有表現 (Named Entity: NE) の抽出 (Extract) と意図の
推定 (Intent Estimation) は初歩的かつ基本的な自然言語処理である. 過去の対話
システム研究において, 日本語における形態素解析, 品詞推定, 係り受け解析,
パターンマッチングなどを様々なOSSを組み合わせることで実現している例が
多く存在する. しかし, そういったシステムは複雑かつコード量が多いという
課題も存在する. そのような特徴はオフライン小型ロボットの組み込み用途に
使う場合に障壁となる. 本研究では, プログラミング言語が標準で装備している
正規表現のみを活用することでコード量を劇的に削減した上で同等の機能を
実現する実装を試作した結果を紹介する.

(06)
依存構造に基づく単語から語義の分散表現への細分化
芦原 和樹,梶原 智之,荒瀬 由紀(大阪大),内田 諭(九州大)

多くの自然言語処理タスクにおいて単語分散表現が利用されている。しかし、
各単語に1つの分散表現を割り当てるアプローチでは、多義語における各語義
の情報が混在してしまう。この問題に対処するために、先行研究では品詞や
トピックごとに異なる分散表現を割り当てたが、これらの手法には多義性を
扱う粒度が粗いという課題がある。本研究では、単語間の依存関係を手がかり
として各単語に複数の分散表現を割り当てる手法を提案する。提案手法は、
先行研究よりも細かい粒度で多義性を扱うことができる反面、データスパース
ネス問題が危惧される。そこで我々は、多義語における各分散表現の初期値と
して、語義を区別せずに事前学習した分散表現を用いることでこの問題に対処
する。単語間の意味的類似度タスクおよび語彙的換言タスクにおける実験の
結果、提案手法は各単語に複数の分散表現を割り当てる先行研究よりも高い
性能を発揮した。また、詳細な分析の結果、初期化がデータスパースネス問題
を解決することも確認できた。

(07)
文字分散表現に基づく単語分類情報を用いたレシピ固有表現抽出
平松 淳,若林 啓(筑波大),原島 純(クックパッド)

固有表現抽出は自然言語処理の基本的なタスクの1つであり,活発に研究が行
われている.固有表現の抽出を行うためには,テキストに対して固有表現を
付与した教師データが必要である.しかし,ドメインごとに教師データを構築
することはコストが大きい.そこで,本研究では教師データだけではなく,
ドメインに関連する言語資源を利用する固有表現抽出モデルを提案する.具体
的には,文字分散表現に基づいて文中の単語を言語資源中で定めたカテゴリに
分類し,分類情報を固有表現抽出モデルの入力として利用する.このモデルに
ついて料理ドメインのデータを用いて実験し,その結果を報告する.

[12:15-14:00] 昼休み

[14:00-15:00] 深層学習 (2件)
(08)
構文情報を陽に与えたときの LSTM-RNN による内部表現について
岡本 千尋(東京工科大),内海 慶(デンソーアイティーラボラトリ),
持橋 大地(統計数理研)

長短期記憶リカレントニューラルネット (LSTM-RNN) は,構文情報に代表され
るような,文中の有用な長期依存関係を捉えることにより,高精度な言語モデ
ルを学習することができることが知られている.しかし逆に,一般的にどの
程度構文情報を学習できているのかや,どのように構文情報がベクトルとして
RNN内に表現されるかについては,まだ十分に研究がされていないのが現状で
ある.そこで,我々はその初歩として,英語における句構造をあらわす構文木
を線形化し文として与えて学習させたときに,RNN内で構文情報がどのように
エンコードされるかについて詳細に分析した.その結果,L1 正則化を用いる
ことで例えば RNN 内の内部ベクトルのうち少数の要素の値が,VP, N Pなど
句構造の各タグごとのネストの深さと非常に高い相関を持つこと,および,
同じく少数の要素の値から,VP, NP などの内外にいることを高精度で線形
分離できること,などがわかった.

(09)
文脈自由文法とニューラルネットワークを用いた並列構造木のCKY構文解析
寺西 裕紀,進藤 裕之,松本 裕治(NAIST)

本研究は文脈自由文法を用いて並列構造を木として導出する手法を提案する.
現在の最高精度の解析性能を達成しているニューラルネットワークによる並列
構造解析の手法は,文中の複数の並列構造や3つ以上の並列句を陽に扱って
おらず,解析結果を他のタスク等に利用することが難しい.複数の並列構造や
3 つ以上の並列句の解析を行う場合,並列構造となりうる句のスパンの組み
合わせが指数的に増加するため膨大な計算コストを要するという問題がある.
そこで本研究では並列構造を木として導出できる文脈自由文法を定義し,計算
量を抑えながら並列構造の木をボトムアップで構築する.実験の結果,提案
手法によって文中の複雑な並列構造の範囲が競合せず導出できることを保証
しながら,個々の並列構造ごとの評価において既存手法と同等以上の解析性能
を得たことを示す.

[15:00-15:15] クロージング

9月27日(木)9:00-13:00 カーリング体験会

=============================
★研究報告のペーパーレス化
本研究会はペーパーレスでの開催となり,印刷した研究報告の配布を行い
ません.また,特許出願の公知日(研究報告の公開日)が従来より1週間
早まりますので,ご留意ください.

※自然言語処理研究会に登録されている方
研究報告は研究発表会の1週間前に電子図書館と当日閲覧用サイトで公開
します.当日は資料をプリントアウトしてご持参いただくか,ご自身の
PCにダウンロードのうえ,ご持参ください.

情報処理学会電子図書館(情報学広場)
https://ipsj.ixsq.nii.ac.jp/ej/ (ユーザ登録が必要です)
当日閲覧用サイト
http://www.ipsj.or.jp/sig-reports/

※自然言語処理研究会に登録されていない方
当日受付で本研究発表会の資料閲覧用にUSBメモリを貸し出します.
当日はノートPC等をご持参ください.なお,当研究会にご登録頂くことで,
本研究会の資料をバックナンバーも含めて電子図書館で購読できます.
登録されていない方は,是非この機会に研究会に登録してください
(登録まで最大3日かかりますのでご留意ください).

★研究会への登録をお勧めします
年に2回以上の参加を見込まれる方は,研究会に登録される方が(ほぼ)
お得になります.研究会登録は以下のウェブサイトから行えます.
http://www.ipsj.or.jp/kenkyukai/toroku.html

★研究会幹事団
主査:
関根聡  (理研)
幹事:
荒瀬由紀 (大阪大学)
木村俊也 (株式会社メルカリ)
進藤裕之 (奈良先端科学技術大学院大学)
中澤敏明 (東京大学)
西川仁  (東京工業大学)
桝井文人 (北見工業大学)
横野光  (株式会社富士通研究所)
運営委員:
浅原正幸 (国立国語研究所)
荒牧英治 (奈良先端科学技術大学院大学)
石野亜耶 (広島経済大学)
内海慶  (株式会社デンソーアイティーラボラトリ)
内田ゆず (北海学園大学)
小林隼人 (Yahoo! JAPAN 研究所)
佐々木稔 (茨城大学)
笹野遼平 (名古屋大学)
貞光九月 (フューチャー株式会社)
佐藤敏紀 (LINE株式会社)
数原良彦 (Recruit Institute of Technology)
高村大也 (産業技術総合研究所/東京工業大学)
土田正明 (株式会社コトバデザイン)
徳永拓之 (LeapMind株式会社)
二宮崇  (愛媛大学)
羽鳥潤  (株式会社 Preferred Networks)
藤田早苗 (日本電信電話株式会社)
牧野拓哉 (株式会社富士通研究所)
松崎拓也 (名古屋大学)
松林優一郎(東北大学)
ミハウ・プタシンスキ(北見工業大学)
村脇有吾 (京都大学)
若木裕美 (ソニー株式会社)

===============================================

第237回自然言語処理研究会 発表募集

情報処理学会 第237回自然言語処理研究会 発表募集
https://nl-ipsj.or.jp

●日程: 2018年9月25日 (火)・26日 (水)
●会場: 北見工業大学
アクセス・キャンパスマップ:
http://www.kitami-it.ac.jp/about/access/

●発表申込締切: 2018年8月17日 (金)
●原稿締切: 2018年8月31日 (金) ※厳守

●原稿ページ数:2ページ以上
電子化にともないページ数に上限はありません.
※ただし20ページを越える場合は事前にご連絡ください.

●発表時間予定: 一般講演形式 1件30分 (発表20分、質疑10分)

※ 発表時間の調整について
従来の一般講演形式(発表20分,質疑10分)に加えてショート形式(発表10分,
質疑10分),討議形式(発表10分,質疑討論20分)など,発表者からの要望
に応じて発表の合計時間を調整します.アイデアレベルの研究
の紹介や,研究の詳細まで話したいので時間がほしい,などの要求を発表
申込の備考欄にご記入いただければ,それらを考慮してプログラムを作成
します.ぜひご活用ください.

●優秀研究賞
研究会に投稿された予稿の中から特に優れたものを優秀研究賞として表彰
する予定です.

●発表申込先: 下記専用サイトよりお申込みください.
https://ipsj1.i-product.biz/ipsjsig/NL/
(研究会ホームページからもアクセスできます)

●動画中継
今回の研究会では,インターネットを利用した研究発表の動画中継を予定
しております.基本的にすべての発表を動画中継の対象とする予定ですが,
発表者の希望により対象から外すことも出来ますので,研究発表の当日に
その旨お伝えください.動画中継の詳細については,追ってアナウンス
いたします.

●併設イベント:
9月27日の午前に「カーリング体験会」を開催する予定ですので,奮って
ご参加下さい.
日程: 2018年9月27日 (木) 午前
会場: アドヴィックス常呂カーリングホール
http://www.okhotsk-sports-camp.jp/facility/detail.php?fcid=21
参加費:1,000円程度を予定
備考: オリンピック代表選手に講師依頼予定です.
送迎バスを準備します.9:00 北見駅付近発~13:00北見駅付近着
復路は女満別空港を経由します.
– 参加ご希望の方は,以下よりお申し込み下さい.
https://goo.gl/SWy9t3

●問い合わせ先:
桝井文人,プタシンスキ・ミハウ(北見工業大学)
E-mail: staff (at) mail.kitami-it.ac.jp

●今後の予定
第238回研究会 2018年12月予定

★研究報告のペーパーレス化
本研究会はペーパーレスでの開催となり,印刷した研究報告の配布を行い
ません.また,特許出願の公知日(研究報告の公開日)が従来より1週間
早まりますので,ご留意ください.

※自然言語処理研究会に登録されている方
研究報告は研究発表会の1週間前に電子図書館と当日閲覧用サイトで公開
します.当日は資料をプリントアウトしてご持参いただくか,ご自身の
PCにダウンロードのうえ,ご持参ください.

情報処理学会電子図書館(情報学広場)
https://ipsj.ixsq.nii.ac.jp/ej/ (ユーザ登録が必要です)
当日閲覧用サイト
http://www.ipsj.or.jp/sig-reports/

※自然言語処理研究会に登録されていない方
当日受付で本研究発表会の資料閲覧用にUSBメモリを貸し出します.
当日はノートPC等をご持参ください.なお,当研究会にご登録頂くことで,
本研究会の資料をバックナンバーも含めて電子図書館で購読できます.
登録されていない方は,是非この機会に研究会に登録してください
(登録まで最大3日かかりますのでご留意ください).

★研究会への登録をお勧めします
年に2回以上の参加を見込まれる方は,研究会に登録される方が(ほぼ)
お得になります.研究会登録は以下のウェブサイトから行えます.
http://www.ipsj.or.jp/kenkyukai/toroku.html

★受け付けは先着順で行なっております
多数のお申し込みを頂いた場合,次回の研究会にまわって頂くよう
お願いする場合があります.なるべく早めにお申し込み下さい.

★締め切り後の発表キャンセルは原則としてできません
発表申し込み後にキャンセルの必要が生じた場合は,至急ご連絡ください.
発表申込後,原稿提出締め切りまでに原稿が到着しない場合には,幹事団の
判断により発表を取り消しさせていただくこともあります.

★論文提出締切後の原稿差し替えはできません
論文提出締切後は,訂正版のアップロードやウェブ上での配布などの原稿
差し替えは一切できませんので,予めご留意ください.
※正誤表の掲載が可能な場合がありますのでご相談ください.

★研究会幹事団
主査:
関根聡  (理研)
幹事:
荒瀬由紀 (大阪大学)
木村俊也 (株式会社メルカリ)
進藤裕之 (奈良先端科学技術大学院大学)
中澤敏明 (東京大学)
西川仁  (東京工業大学)
桝井文人 (北見工業大学)
横野光  (株式会社富士通研究所)
運営委員:
浅原正幸 (国立国語研究所)
荒牧英治 (奈良先端科学技術大学院大学)
石野亜耶 (広島経済大学)
内海慶  (株式会社デンソーアイティーラボラトリ)
内田ゆず (北海学園大学)
小林隼人 (Yahoo! JAPAN 研究所)
佐々木稔 (茨城大学)
笹野遼平 (名古屋大学)
貞光九月 (フューチャー株式会社)
佐藤敏紀 (LINE株式会社)
数原良彦 (Recruit Institute of Technology)
高村大也 (産業技術総合研究所/東京工業大学)
土田正明 (株式会社コトバデザイン)
徳永拓之 (LeapMind株式会社)
二宮崇  (愛媛大学)
羽鳥潤  (株式会社 Preferred Networks)
藤田早苗 (日本電信電話株式会社)
牧野拓哉 (株式会社富士通研究所)
松崎拓也 (名古屋大学)
松林優一郎(東北大学)
ミハウ・プタシンスキ(北見工業大学)
村脇有吾 (京都大学)
若木裕美 (ソニー株式会社)

第236回自然言語処理研究会 参加募集

情報処理学会 第236回自然言語処理研究会 参加募集
https://nl-ipsj.or.jp

●日程: 2018年7月9日(月),10日(火)

●会場: 理化学研究所 革新知能統合研究センター (AIP)
コレド日本橋15階
https://aip.riken.jp/access

●意見交換会
7月9日(月) 16:20から研究会会場にて,お茶菓子等をご用意した
意見交換会の開催を予定しております.人数の把握のため,参加を
希望される方は6月29日(金)までに以下のフォームからご入力下さい.

https://goo.gl/forms/hZXt7iu5YgVr7NWf1

●動画中継
今回の研究会では,インターネットを利用した研究発表の動画中継を予定
しております.基本的にすべての発表を動画中継の対象とする予定ですが,
発表者の希望により対象から外すことも出来ますので,研究発表の当日に
その旨お伝えください.閲覧方法についてはNL研ホームページでご案内す
る予定です.

配信URL

●問い合わせ先:
横野光((株)富士通研究所)
E-mail: yokono.hikaru (at) jp.fujitsu.com

==================
プログラム

7月9日(月) 10:15-16:10 (6件+招待講演1件)
[10:15-11:45] 分散表現 (3件)
[11:45-13:30] 昼休み
[13:30-14:30] 招待講演 (1件)
[14:30-14:40] 休憩
[14:40-16:10] 言語処理応用 (3件)
[16:20-17:50] 意見交換会

7月10日(火) 10:15-15:55 (7件)
[10:15-11:45] 構文解析・意味解析 (3件)
[11:45-13:30] 昼休み
[13:30-14:30] 対話 (2件)
[14:30-14:40] 休憩
[14:40-15:40] Web言語処理 (2件)
[15:40-15:55] クロージング

7月9日(月) 10:15-16:10
[10:15-11:45] 分散表現 (3件)

座長 : 中澤敏明(東京大学)

(1) 分散表現のファインチューニングによる語義曖昧性解消の領域適応

柳沼 大輝, 古宮 嘉那子, 新納 浩幸 (茨城大)

本論文では語義曖昧性解消の領域適応の問題を扱う。質の高い分散表現を用い
ることで、語義曖昧性解消の精度が向上することが知られている。しかし質の
高い分散表現を使用した語義曖昧性解消であっても領域が変化することによる
悪影響を受ける。そこでターゲットデータのコーパスを利用して、分散表現を
ターゲットデータにファインチューニングすることで、語義曖昧性解消の領域
が変化することによる悪影響に対処する。実験では分散表現としてnwjc2vec
及び日本語 Wikipediaから構築した分散表現を用いる。ターゲットデータと
して「Yahoo! 知恵袋」「新聞」「白書」の3つから計6通りの領域適応を行う。
語義曖昧性解消は各領域に共通して出現する72単語を対象とした。実験の結果、
比較的小さなターゲットデータに対してはファインチューニングの効果が確認
できた。

(2) 教師なしニューラル単語分割を用いた分散表現獲得

平岡 達也, 進藤 裕之, 松本 裕治 (NAIST)

教師なし単語分割はギブスサンプリングによる言語モデルの尤度最大化として
行う手法が提案されている[持橋,2009].また,分割の際に用いる言語モデル
をニューラル言語モデルに置き換える試みも[友利,2018]にて提案されている.
しかしニューラルネットワークを用いた手法には計算コストが高いという問題
がある.本論文ではモデルの単純化により計算コストを軽減する手法について
提案する.さらに分割によって得られた単語分散表現が,日本語の文分類タス
クにおいて有効であることを確認した.

(3) ArtistVector: Web文書分散表現によるアーティスト特徴量獲得

篠井 暖 (ヤマハ)

音楽ファンにとって,自分の好みに合う新たな楽曲に出会えることは大きな喜
びである.近年の定額制音楽配信サービスの普及で膨大な量の楽曲を聴取可能
になった一方で,数百万〜数千万曲という規模の楽曲の中から好みに
合う楽曲をひとつひとつ試聴しながら探すのはもはや不可能になっており,リ
スナーの好みに合う楽曲を簡単に検索可能な仕組みが必要になっている.本稿
では,楽曲を探す際の有力な手がかりとしてアーティスト情報に着目し,アー
ティストの特徴抽出手法について検討する.アーティストに関する情報を記述
した文書の潜在表現を学習することによりアーティストのベクトル表現
(ArtistVector)を獲得し,クエリアーティストと類似するアーティストを検
索可能にする手法を提案する.アーティストを特徴づける文書として,(1)アー
ティスト自身の説明を記述した文書 と (2)リスナーからのアーティストの評価
を記述した文書 が重要になると考え,両者に対応する文書としてWikipedia記
事とWebレビュー記事を学習データに利用してArtistVectorを獲得した.得ら
れたArtistVectorに対しジャンル分類タスクによる評価を行い,データセット
および手法の有効性を検証した.またArtistVectorをUMAPにより2次元平面上
に可視化し,コンテキストに基づく関係性を反映した類似アーティストが得られ
ていることを確認した.

[11:45-13:30] 昼休み
[13:30-14:30] 招待講演

(4) ニューラル構文解析とその周辺

能地 宏(産総研)

構文解析は自然言語処理において古典的な問題であるが、近年の深層学習の枠組
みの中では、不要な道具として扱われることも多い。しかしながら、深層学習は
構文解析の研究自体にもブレークスルーをもたらしており、特にこれまで考えら
れなかったほどの精度向上や、また実用的なドメイン適応など、構文解析に携わっ
てきた者としては、いよいよ実際に役に立つ道具になってきたのではないか、と
も思わされる。本講演の前半では、このような構文解析をめぐる研究の動向につ
いてまとめる。また近年の関連する話題として、RNNなどの線形モデルが文の階
層構造を捉えているか否か、という議論がある。このような研究は、ニューラル
ネットワークによる一貫学習の際に文構造などを明示的に考慮すべきかについて
示唆を与えるものとも言え、興味深い。後半はこれらの研究に焦点をあて、今後
の方向性について議論する。

[14:30-14:40] 休憩
[14:40-16:10] 言語処理応用 (3件)

座長 : 関根聡(理化学研究所)

(5) Distant Supervisionによる質問要約

石垣 達也, 町田 和哉 (東工大), 小林 隼人 (ヤフー),
高村 大也 (東工大/産総研), 奥村 学 (東工大)

学会での質疑応答やEメールなどにおいて用いられる質問には、核となる文の他
に補足的な情報も含まれ、ときに冗長になる。本研究ではこのような長文質問を
その内容を端的に表現するより短い質問に要約する課題を扱う。既存研究では、
コミュニティQAサイトに投稿される質問の本文とタイトルの対を長文質問とその
要約とみなし、教師あり要約モデルを構築する手法が提案されている。しかし、
例えば日本語のYahoo! 知恵袋などにおいてはタイトルが存在せず、先行研究の
ように擬似的な教師データの獲得が難しい。そこで、本研究では、Distant
Supervisionの考えに基づく抽出型質問要約器を提案する。評価実験において、
提案要約器が教師あり及び教師なし学習に基づくベースライン手法よりも良い性
能を示した。

(6) Exploring Crowdsourceable Annotation Protocol for Argumentation Schemes

Naoya Inoue (Tohoku Univ./RIKEN AIP), Paul Reisert (RIKEN AIP),
Kentaro Inui (Tohoku Univ./RIKEN AIP)

Argumentation scheme classification is an important core
technology for argumentation analysis. As of yet, however,
there is no reliable, large-scale corpus annotated with
argumentation schemes. To address this issue, this study
discusses the potential of crowdsourcing as a plausible way
for large-scale annotation of argumentation schemes. We report
ongoing efforts on crowdsourcing annotation of Argument from
Consequences for policy (should/should-not) arguments.
The preliminary experiments demonstrate that the annotation task
is reasonably achieved by crowdworkers.

(7) 機械翻訳のための日本語若者言葉の言い換えに関する一考察

何 婉瑩 (東京都市大/大連交通大), ハダノウィチ アレクセイ, 藤田 和成,
浅沼 爽汰, 田村 亮介 , 町田 翔, 山田 紘司, 延澤 志保 (東京都市大)

翻訳機の精度は向上しているが,機械翻訳による翻訳文は直訳や誤った翻訳が多
く,特にSNSを最も多く使う若者たちが使っている若者言葉は正しく翻訳できる
ものがほぼない.日本語の若者言葉を含む句を機械翻訳器に翻訳させる際,前処
理として若者言葉部分を一般的な言い回しへ置換することで翻訳正解率は向上す
る.本稿では日本語の若者言葉を含む句を対象として言い換え処理を伴う機械翻
訳を行った結果について,対象言語が中国語の場合とロシア語の場合それぞれ分
析を行った結果をまとめる.

[16:20-17:50] 意見交換会

7月10日(火) 10:15-15:55 (7件)

[10:15-11:45] 構文解析・意味解析 (3件)

座長 : 横野光(富士通研究所)

(8) 重み行列の対称性および巡回性の仮定に基づく双アフィン分類器の冗長性削減

松野 智紀 (NAIST), 林 克彦 (阪大), 石原 敬大 (NAIST),
真鍋 陽俊 (ワークスアプリケーションズ), 松本 裕治 (NAIST)

現在,係り受け解析の分野ではDozat and Manning (2017)によって提案され
たDeep Biaffine parserがその非常に高い解析精度から注目を集めている.
一方で,そのスコア計算に用いられる双線型項の重み行列はシステム全体におけ
るパラメータの約19%を占めており,メモリや計算効率の観点から大きな問題と
なっている.本稿では重み行列に対称性あるいは巡回性という仮定を加えること
で,その問題を解決する新たな手法を提案する.CoNLL 2017 shared task
のデータセットを使った実験から,重み行列に巡回行列を用いたモデルではパラ
メータ数を18%以上削減できる上,ほとんどの言語でベースラインと同程度かそ
れ以上の解析精度を達成できる事がわかったので報告する.

(9) 意味役割付与のためのスパン選択モデル

大内 啓樹 (理研/東北大), 進藤 裕之, 松本 裕治 (NAIST)

本稿では,スパン(フレーズ)に基づいた意味役割付与モデルを提案する.提案モ
デルは,可能なスパン集合のそれぞれにスコアをつけ,スコアの高いスパンを予
測として出力する.提案モデルの長所は,スパンレベルの特徴量を利用できる点
である.これは,BIOタグ付けに基づいた最先端の意味役割付与モデルでは利用
できなかったものである.実験の結果,本提案モデルがこれまでの英語意味役割
付与における最高精度を上回る性能であることを確認した.

(10) 類似用例の利用により多義性に対応した日本語述語項構造解析

芝原 隆善 (NAIST), 濱口 拓男 (理研), 松本 裕治 (NAIST)

本研究では文内の日本語述語項構造解析に取り組む.述語項構造解析は文章内に
含まれる述語とその項の間の関係を推定するタスクであり,その推定には文の構
造を把握するだけではなく,指定された単語がどのような意味を持つか把握する
ことが重要である.単語の意味に関して,先行研究は2つのアプローチを取ってい
る.1つは用例の分類として定められた意味を利用するアプローチであり,もう
1つは単語埋め込みに意味を学習させる事前訓練によるアプローチである.これ
らのアプローチはそれぞれ利点を持つ反面,1つの共通した課題を持つ.それは
単語の意味を静的に決めてしまう点である.用例の分類として語義を定めるアプ
ローチは典型的な意味以外の用法や用例を捉えるのが難しい.事前学習による単
語埋め込みを用いるアプローチは,語義を固定長のベクトルに全て押し込めるた
め,多くの語義を持つ単語の意味を取りこぼしてしまう懸念がある.これらの課
題を解決するため,本研究では外部コーパスから動的に単語表現を獲得するアプ
ローチを取る.より具体的には,着目した単語に類似する用例を外部コーパスか
ら集め,それぞれに対してAttentionを用いることで,似た用例とそれに基づ
く単語表現を獲得することで,日本語述語構造解析をより効果的に解くことを
目指す.

[11:45-13:30] 昼休み
[13:30-14:30] 対話 (2件)

座長 : 内海慶(株式会社デンソーアイティーラボラトリ)

(11) 高齢者と家族とのコミュニケーションの質の向上に向けて:高齢者のQuality of Life 表出発話の分析

徳久 良子, 寺嶌 立太 (豊田中研), 乾 健太郎 (東北大)

我々は,高齢者と家族とのコミュニケーションにおいて,高齢者のQOL表出発話
(聞き手が高齢者の発話から高齢者のQOL を推定できる発話) の生成をサポート
することで,高齢者のQOLを家族に伝え,両者のコミュニケーションの質を向上
させるシステムの構築を目指している.本稿では,高齢者と家族との対話を分析
し,右記の2点を明らかにする.(1) 高齢者と家族との通常の(システムのサポー
トのない)コミュニケーションにおいて高齢者のQOL がどのように表出するか.
(2)QOL表出発話にはどのような特徴があるか.クラウドソーシングで収集した
501名による発話を分析した結果,高齢者の行動や状態を表す発話,要望を表す
発話,具体的な内容を述べる発話が高齢者のQOL 表出発話の度合が高い発話で
あることが分かった.

(12) タスク指向対話におけるユーザ要求の理解とその根拠の抽出

福永 隼也, 西川 仁, 徳永 健伸 (東工大), 横野 光, 高橋 哲朗 (富士通研)

本論文は,データベース検索を行うタスク指向型対話を対象として,ユーザ発話
中で明示的に述べられていないユーザ要求の解釈をおこなう手法を提案する.
ユーザ発話において,検索条件としてデータベースフィールドとその値が明示的
に指定されない場合,その発話を直接データベースへのクエリに変換することは
できない.しかし,そのような発話中にも明示的に述べられないユーザ要求が含
まれる場合があり,それを解釈することは,対話システムがより自然で効率的な
データベース検索対話をおこなうために重要である.本論文ではこのように明示
的に述べられないユーザ要求を非明示的条件と呼ぶ.また,非明示的条件の解釈
を,ユーザ発話を関連するデータベースフィールドに紐づけ,また同時にその根
拠となるユーザ発話中の文字列を抽出する課題として定式化する.このような新
しい課題を提案するとともに,課題に対する2つの手法として,サポートベクター
マシンに基づく手法と,分類と根拠となる部分文字列の抽出を同時に行うニュー
ラルネットワークによる手法を実装した.不動産に関する対話のコーパスを利用
した評価実験の結果,サポートベクターマシンに基づく手法がより良好な結果を
示すことがわかった.

[14:30-14:40] 休憩
[14:40-15:40] Web言語処理 (2件)

座長 : 進藤裕之(奈良先端科学技術大学院大学)

(13) 政治情報の信憑性判断における情報アクセス技術の役割 -NTCIR-14 QA Lab-PoliInfoタスクの提案-

木村 泰知 (小樽商大/理研AIP), 渋木 英潔 (横浜国大), 阪本 浩太郎 (横浜国大/NII),
石下 円香 (NII), 三田村 照子 (CMU), 神門 典子 (NII/総研大)

本稿では、Web上の情報信憑性を扱った自然言語処理の分野における従来研究を
概観し、自然言語処理による情報アクセス技術を用いることで、Web上の政治情
報の信憑性を判断する上でどのように貢献できるか考察する。また、NTCIR-14
QA Lab-PoliInfoで我々が提案している3つのタスク、Segmentation Task、
Summarization Task、Classification Taskについて説明し、その位置づ
けを述べる。

(14) 建設的ニュースコメントの順位付けのためのデータセット構築

藤田 綜一郎 (東工大), 小林 隼人 (ヤフー), 奥村 学 (東工大)

オンラインニュースサイトには,ニュース記事毎に読者の議論の場としてコメン
ト欄が設けられているものがある.そこではニュースに関する建設的なコメント
が投稿される一方で,差別的または特定の主義主張に偏ったコメントも投稿され
るため,活発な議論を促すコメントが埋もれてしまう可能性があるという問題が
ある.そこで,本稿では建設的なコメントを優先的に提示することによる議論の
活性化を目指し,コメントを建設的なコメント順に並び変えることを試みる.具
体的には,コメントの建設的度合いをスコア化したデータセットを構築し,ラン
キング学習を用いて順位付けを行う.加えて,その応用として,効率的なデータ
の拡張による順位付けの精度向上を目的に,能動学習を用いてランキングモデル
を学習する方法について考察する.

[15:40-15:55] クロージング

=============================

★研究報告のペーパーレス化
本研究会はペーパーレスでの開催となり,印刷した研究報告の配布を行い
ません.また,特許出願の公知日(研究報告の公開日)が従来より1週間
早まりますので,ご留意ください.

※自然言語処理研究会に登録されている方
研究報告は研究発表会の1週間前に電子図書館と当日閲覧用サイトで公開
します.当日は資料をプリントアウトしてご持参いただくか,ご自身の
PCにダウンロードのうえ,ご持参ください.

情報処理学会電子図書館(情報学広場)
https://ipsj.ixsq.nii.ac.jp/ej/ (ユーザ登録が必要です)
当日閲覧用サイト
http://www.ipsj.or.jp/sig-reports/

※自然言語処理研究会に登録されていない方
当日受付で本研究発表会の資料閲覧用にUSBメモリを貸し出します.
当日はノートPC等をご持参ください.なお,当研究会にご登録頂くことで,
本研究会の資料をバックナンバーも含めて電子図書館で購読できます.
登録されていない方は,是非この機会に研究会に登録してください
(登録まで最大3日かかりますのでご留意ください).

★研究会への登録をお勧めします
年に2回以上の参加を見込まれる方は,研究会に登録される方が(ほぼ)
お得になります.研究会登録は以下のウェブサイトから行えます.
http://www.ipsj.or.jp/kenkyukai/toroku.html

★研究会幹事団
主査:
関根聡  (理化学研究所)
幹事:
荒瀬由紀 (大阪大学)
木村俊也 (株式会社メルカリ)
進藤裕之 (奈良先端科学技術大学院大学)
中澤敏明 (東京大学)
西川仁  (東京工業大学)
桝井文人 (北見工業大学)
横野光  (株式会社富士通研究所)
運営委員:
浅原正幸 (国立国語研究所)
荒牧英治 (奈良先端科学技術大学院大学)
石野亜耶 (広島経済大学)
内海慶  (株式会社デンソーアイティーラボラトリ)
内田ゆず (北海学園大学)
小林隼人 (Yahoo! JAPAN 研究所)
佐々木稔 (茨城大学)
笹野遼平 (名古屋大学)
貞光九月 (フューチャー株式会社)
佐藤敏紀 (LINE株式会社)
数原良彦 (Recruit Institute of Technology)
高村大也 (産業技術総合研究所/東京工業大学)
土田正明 (株式会社コトバデザイン)
徳永拓之
二宮崇  (愛媛大学)
羽鳥潤  (株式会社 Preferred Networks)
藤田早苗 (日本電信電話株式会社)
牧野拓哉 (株式会社富士通研究所)
松崎拓也 (名古屋大学)
松林優一郎(東北大学)
ミハウ・プタシンスキ(北見工業大学)
村脇有吾 (京都大学)
若木裕美 (ソニー株式会社)