第5回自然言語処理シンポジウム(第238回自然言語処理研究発表会)参加募集

本シンポジウムは
* 情報処理学会 自然言語処理研究会
https://nl-ipsj.or.jp
* 電子情報通信学会 言語理解とコミュニケーション研究会
http://www.ieice.org/~nlc/wiki/wiki.cgi
http://www.ieice.org/~nlc/nlsympo18p.html
による合同開催(連催)です.

また,12月10日ならびに11日は音声関連の合同研究会(SP,SLP)が同じ
会場で開催(併催)されます.
12月11日は本シンポジウムと日程が重なっており,言語処理のみならず
音声関連の研究者との意見交換ができます.
3日間参加すると音声処理から言語処理研究まで聴講できます.

●動画中継:
当研究会では,インターネットを利用した研究発表のライブ中継を行う予定です.
下記ページより視聴予約が可能です.当日会場へご参加できない方は,是非ご視聴ください.
(一部配信されない発表・セッションがありますが予めご了承ください)

情報処理学会公式ニコニコチャンネル:
http://ch.nicovideo.jp/ipsj/live

●日程:2018年12月11日(火)および12日(水)

●会場:早稲田大学西早稲田キャンパス 55号館N棟1階 大会議室
〒169-8555 新宿区大久保3-4-1
https://www.waseda.jp/top/access/nishiwaseda-campus
(副都心線 西早稲田駅に直結
JR山手線・西武新宿線 高田馬場駅から徒歩15分)

——————–
●プログラム
12月11日(火) 午後 オープニング (13:00 – 13:10)

13:00 – 13:10
オープニング
榊剛史 (ホットリンク)

12月11日(火) 午後 招待講演 (13:10 – 14:00)
座長: 榊剛史 (ホットリンク)

(1) 13:10 – 14:00
[招待講演]DeepLearningと科学計算環境
○中山浩太郎(東大/NABLABS)

−−− 休憩 ( 15分 ) −−−

12月11日(火) 午後 機械翻訳・文法誤り訂正 (14:15 – 15:45)
座長: 中澤敏明(東京大学)

(2) 14:15 – 14:45
[NLC] 単語分散表現を用いたEarth Mover’s
Distanceと文長の違いに基づく類似度による対訳文の自動抽出
○田上 諒・越前谷 博(北学園大)・荒木健治(北大)

(3) 14:45 – 15:15
[NL] 双方向の逆翻訳を利用したニューラル機械翻訳の教師なし適応の検討
○秋葉 友良・塚田 元・森田 知熙(豊橋技術科学大)

(4) 15:15 – 15:45
[NL] 低頻度語学習手法を用いたConvolutional
Encoder-Decoderモデルによる文法誤り訂正
○町田 翔・藤田 和成・延澤 志保・荒井 秀一(東京都市大)

−−− 休憩 ( 15分 ) −−−

12月11日(火) 午後 深層学習 (16:00 – 17:30)
座長: 木村 俊也(株式会社メルカリ)

(5) 16:00 – 16:30
[NL] 大規模格フレームによる解析候補削減を用いたニューラルネットゼロ照応解析
○山城 颯太・西川 仁・徳永 健伸(東工大)

(6) 16:30 – 17:00
[NL] Very Deep CNNによる文書分類におけるトピック分布を用いた事前学習
○守屋 俊・岡本 千尋(東京工科大)

(7) 17:00 – 17:30
[NL] 係り受け誤り埋め込み表現のクラスタリングによるドメイン適応の効果の分析
○原 拓也・松崎 拓也・佐藤 理史(名古屋大)

12月12日(水) 午前 言語処理応用I (10:00 – 11:30)
座長: 荒瀬由紀(大阪大学)

(8) 10:00 – 10:30
[NL] 災害時避難支援のためのTwitterからの現在地周辺情報の抽出
○浅沼 爽汰・藤田 和成・田村 亮介・白石 絵里奈・白井 聡一・町田 翔・延澤 志保(東京都市大)

(9) 10:30 – 11:00
[NL] 機械読解精度向上のための英文読解問題データの分析
○藤田 和成・浅沼 爽汰・田村 亮介・坂井 優介・町田 翔・延澤 志保(東京都市大)

(10) 11:00 – 11:30
[NLC] 罹患者への定型的応答を利用したツイート罹患判定のデータ拡張
○浅川 玲音・秋葉 友良(豊橋技科大)

−−− 昼食 ( 90分 ) −−−

12月12日(水) 午後 国際会議報告 (13:00 – 14:00)
座長: 桝井 文人(北見工大)

(11) 13:00 – 13:30
国際会議CoNLL2018参加報告
斉藤 いつみ (NTT)

(12) 13:30 – 14:00
国際会議EMNLP2018参加報告
大内 啓樹(理研AIP/東北大学)

−−− 休憩 ( 15分 ) −−−

12月12日(水) 午後 言語解析 (14:15 – 15:15)
座長: 横野光(株式会社富士通研究所)

(13) 14:15 – 14:45
[NL] 外界一人称と二人称を考慮する日本語述語項構造解析の分野適応
○珊瑚 彩主紀・西川 仁・徳永 健伸(東工大)

(14) 14:45 – 15:15
[NL] 文情報の活用と階層構造に着目した固有表現ラベル推定手法
○白水 優太朗・藤本 拓・吉村 健・礒田 佳徳(株式会社NTTドコモ)

−−− 休憩 ( 15分 ) −−−

12月12日(水) 午後 言語処理応用II (15:30 – 17:30)
座長: 小早川健 (NHK)

(15) 15:30 – 16:00
[NL] テキストに基づく単一オブジェクト画像生成における描画の高品質化
○野本 英梨子・Chu Chenhui・荒瀬 由紀(阪大)

(16) 16:00 – 16:30
[NL] 複数言語複数タスクを扱う発話意図推定モデリングのための敵対的学習の検討
○増村 亮・篠原 雄介・東中 竜一郎・青野 裕司(NTTメディアインテリジェンス研究所)

(17) 16:30 – 17:00
[NLC] 参照データとidfを利用した事前採点不要な小論文評価手法
○大野雅幸・竹内孔一・泉仁宏太・小畑友也・田口雅弘・稲田佳彦・飯塚誠也・
阿保達彦・上田 均(岡山大)

(18) 17:00 – 17:30
[NLC] ニューラル見出し生成システムを用いたニュース編集支援ツールの導入
○村尾一真(ヤフー)・小林隼人(ヤフー/理研)・谷塚太一・小林 健・増山毅
司・日暮 立・田渕義宗(ヤフー)

17:30 – 17:40
優秀研究賞表彰・クロージング
関根聡 (理研)

■予稿集
予稿集はどちらの研究会も電子化されており,NL研の予稿集にはNLC研の原稿も
含まれ,同様にNLC研の予稿集にもNL研の原稿が含まれます.

●発表時間予定: 一般講演形式 1件30分(発表20分,質疑10分)
同一会場で12月10日と11日は音声系研究会(SLP,SP)が併催の予定です.

●優秀研究賞
各研究会それぞれに表彰制度が存在します.それぞれの研究会の申し込み
システムで申し込まれたものがその研究会での選考対象となります.
・NL研:投稿された予稿の中から特に優れたものを優秀研究賞として
クロージングで表彰する予定です.
・NLC研:本シンポジウムに投稿された予稿は2018年の優秀研究賞・学生
研究賞の選考対象となります.

本シンポジウムは
* 情報処理学会 自然言語処理研究会
https://nl-ipsj.or.jp
* 電子情報通信学会 言語理解とコミュニケーション研究会
http://www.ieice.org/~nlc/wiki/wiki.cgi
http://www.ieice.org/~nlc/nlsympo18p.html
による合同開催(連催)です.

また,12月10日ならびに11日は音声関連の合同研究会(SP,SLP)が同じ
会場で開催(併催)されます.
12月11日は本シンポジウムと日程が重なっており,言語処理のみならず
音声関連の研究者との意見交換ができます.
3日間参加すると音声処理から言語処理研究まで聴講できます.

●参加費について
SPとSLPは連催ですので,申込先または主目的で参加する1つの研究会の参加費を
お支払いください.NLとNLCは連催ですので,申込先または主目的で参加する
1つの研究会の参加費をお支払いください.(SP/SLP)と(NL/NLC)は
プログラム上は一体となっていますが,順に開催される別の研究会です。
両者に参加する場合「SPかSLP」への参加費と「NLかNLC」への参加費がそれぞれ必要です.

※電子情報通信学会の申し込みサイトには,「掲載料」との記述がある場合がありますが,
掲載料はかかりません.ただし,今年度から当日参加される発表者にも参加費をお支払い頂きます.

●本シンポジウムに関する問い合わせ先:
nl-sympo@pluto.ai.kyutech.ac.jp
以下の4名に届きます.
NL研担当:進藤 裕之(奈良先端科学技術大学院大学)
NLC研担当:東中 竜一郎(NTT) 嶋田 和孝(九工大) 小早川 健(NHK)

●今後の予定
・NL研:第239回研究会(2019年3月予定) 関東で開催予定
・NLC研:第14回テキストアナリティクスシンポジウム(2019年2月予定)
関西で開催予定

NL研究会幹事団
主査:
関根聡  (理研)
幹事:
荒瀬由紀 (大阪大学)
木村俊也 (株式会社メルカリ)
進藤裕之 (奈良先端科学技術大学院大学)
中澤敏明 (東京大学)
西川仁  (東京工業大学)
桝井文人 (北見工業大学)
横野光  (株式会社富士通研究所)
運営委員:
浅原正幸 (国立国語研究所)
荒牧英治 (奈良先端科学技術大学院大学)
石野亜耶 (広島経済大学)
内海慶  (株式会社デンソーアイティーラボラトリ)
内田ゆず (北海学園大学)
小林隼人 (Yahoo! JAPAN 研究所)
佐々木稔 (茨城大学)
笹野遼平 (名古屋大学)
貞光九月 (フューチャー株式会社)
佐藤敏紀 (LINE株式会社)
数原良彦 (Recruit Institute of Technology)
高村大也 (産業技術総合研究所/東京工業大学)
土田正明 (株式会社コトバデザイン)
徳永拓之 (LeapMind株式会社)
二宮崇  (愛媛大学)
羽鳥潤  (株式会社 Preferred Networks)
藤田早苗 (日本電信電話株式会社)
牧野拓哉 (株式会社富士通研究所)
松崎拓也 (名古屋大学)
松林優一郎(東北大学)
ミハウ・プタシンスキ(北見工業大学)
村脇有吾 (京都大学)
若木裕美 (ソニー株式会社)

NLC研究会幹事団
委員長:
榊剛史  (ホットリンク)
副委員長:
嶋田和孝 (九州工業大学)
吉田光男 (豊橋技術科学大学)
幹事:
渡辺靖彦 (龍谷大学)
東中竜一郎(日本電信電話株式会社)
幹事補佐:
小早川健 (NHK)
坂地泰紀 (東京大学)

第5回自然言語処理シンポジウム(第238回自然言語処理研究発表会)発表募集

本シンポジウムは
* 情報処理学会 自然言語処理研究会
https://nl-ipsj.or.jp
* 電子情報通信学会 言語理解とコミュニケーション研究会
http://www.ieice.org/~nlc/wiki/wiki.cgi
による合同開催(連催)です.

また,12月10日ならびに11日は音声関連の合同研究会(SP,SLP)が同じ
会場で開催(併催)されます.
12月11日は本シンポジウムと日程が重なっており,言語処理のみならず
音声関連の研究者との意見交換ができます.
3日間参加すると音声処理から言語処理研究まで聴講できます.

●日程:2018年12月11日(火)および12日(水)

●会場:早稲田大学西早稲田キャンパス
〒169-8555 新宿区大久保3-4-1
https://www.waseda.jp/top/access/nishiwaseda-campus
(副都心線 西早稲田駅に直結
JR山手線・西武新宿線 高田馬場駅から徒歩15分)

●発表申込締切: 2018年10月12日(金)

●発表申込先: 下記専用サイトよりお申込みください.
・NL研:https://ipsj1.i-product.biz/ipsjsig/NL/
・NLC研:http://www.ieice.org/ken/program/index.php?tgid=NLC
★多数のお申し込みを頂いた場合,次回の研究会にまわって頂くよう
お願いする場合があります.
★締め切り後の発表キャンセルは原則としてできません.

●原稿締切:各研究会(NL研・NLC研)で異なりますが11月中旬の見込みです.
詳細は申し込み後に各研究会から送られてくるメールでご確認ください.
★論文提出締切後の原稿差し替えはできません.

●原稿ページ数:各研究会で異なります
・NL研:2ページ以上
電子化にともないページ数に上限はありません.
※ただし20ページを越える場合は事前にご連絡ください.
・NLC研:6ページ以内

■予稿集
予稿集はどちらの研究会も電子化されており,NL研の予稿集にはNLC研の原稿も
含まれ,同様にNLC研の予稿集にもNL研の原稿が含まれます.

●発表時間予定: 一般講演形式 1件30分(発表20分,質疑10分)
ポスター形式 1セッション90分(予定)
同一会場で12月10日と11日は音声系研究会(SLP,SP)が併催の予定です.
両合同研究会が重なる11日は,ポスター発表を優先的に行います.
申し込みに際しましては,発表形式のご希望をお願いします.
なお,プログラム編成の都合上ご希望に添えないこともあります.

●優秀研究賞
各研究会それぞれに表彰制度が存在します.それぞれの研究会の申し込み
システムで申し込まれたものがその研究会での選考対象となります.
・NL研:投稿された予稿の中から特に優れたものを優秀研究賞として
クロージングで表彰する予定です.
・NLC研:本シンポジウムに投稿された予稿は2018年の優秀研究賞・学生
研究賞の選考対象となります.

●動画中継(NL研究会申し込み分)
NL研究会では,インターネットを利用した研究発表の動画中継を予定して
おります.基本的にすべての発表を動画中継の対象とする予定ですが,
発表者の希望により対象から外すことも出来ますので,研究発表の当日に
その旨お伝えください.動画中継の詳細については,追ってアナウンス
いたします.

●参加費について
SPとSLPは連催ですので,申込先または主目的で参加する1つの研究会の参加費を
お支払いください.NLとNLCは連催ですので,申込先または主目的で参加する
1つの研究会の参加費をお支払いください.(SP/SLP)と(NL/NLC)は
プログラム上は一体となっていますが,順に開催される別の研究会です。
両者に参加する場合「SPかSLP」への参加費と「NLかNLC」への参加費がそれぞれ必要です.

※電子情報通信学会の申し込みサイトには,「掲載料」との記述がある場合がありますが,
掲載料はかかりません.ただし,今年度から当日参加される発表者にも参加費をお支払い頂きます.

●本シンポジウムに関する問い合わせ先:
nl-sympo@pluto.ai.kyutech.ac.jp
以下の4名に届きます.
NL研担当:進藤 裕之(奈良先端科学技術大学院大学)
NLC研担当:東中 竜一郎(NTT) 嶋田 和孝(九工大) 小早川 健(NHK)

●今後の予定
・NL研:第239回研究会(2019年3月予定) 関東で開催予定
・NLC研:第14回テキストアナリティクスシンポジウム(2019年2月予定)
関西で開催予定

NL研究会幹事団
主査:
関根聡  (理研)
幹事:
荒瀬由紀 (大阪大学)
木村俊也 (株式会社メルカリ)
進藤裕之 (奈良先端科学技術大学院大学)
中澤敏明 (東京大学)
西川仁  (東京工業大学)
桝井文人 (北見工業大学)
横野光  (株式会社富士通研究所)
運営委員:
浅原正幸 (国立国語研究所)
荒牧英治 (奈良先端科学技術大学院大学)
石野亜耶 (広島経済大学)
内海慶  (株式会社デンソーアイティーラボラトリ)
内田ゆず (北海学園大学)
小林隼人 (Yahoo! JAPAN 研究所)
佐々木稔 (茨城大学)
笹野遼平 (名古屋大学)
貞光九月 (フューチャー株式会社)
佐藤敏紀 (LINE株式会社)
数原良彦 (Recruit Institute of Technology)
高村大也 (産業技術総合研究所/東京工業大学)
土田正明 (株式会社コトバデザイン)
徳永拓之 (LeapMind株式会社)
二宮崇  (愛媛大学)
羽鳥潤  (株式会社 Preferred Networks)
藤田早苗 (日本電信電話株式会社)
牧野拓哉 (株式会社富士通研究所)
松崎拓也 (名古屋大学)
松林優一郎(東北大学)
ミハウ・プタシンスキ(北見工業大学)
村脇有吾 (京都大学)
若木裕美 (ソニー株式会社)

NLC研究会幹事団
委員長:
榊剛史  (ホットリンク)
副委員長:
嶋田和孝 (九州工業大学)
吉田光男 (豊橋技術科学大学)
幹事:
渡辺靖彦 (龍谷大学)
東中竜一郎(日本電信電話株式会社)
幹事補佐:
小早川健 (NHK)
坂地泰紀 (東京大学)

第237回自然言語処理研究会 参加募集

情報処理学会 第237回自然言語処理研究会 参加募集
https://nl-ipsj.or.jp

●日程: 2018年9月25日 (火)・26日 (水)
●会場: 北見工業大学 A106講義室 (1号館1階)
アクセス・キャンパスマップ:
http://www.kitami-it.ac.jp/about/access/

●動画中継
今回の研究会では,インターネットを利用した研究発表の動画中継を予定
しております.基本的にすべての発表を動画中継の対象とする予定ですが,
発表者の希望により対象から外すことも出来ますので,研究発表の当日に
その旨お伝えください.動画中継の詳細については,追ってアナウンス
いたします.

配信URL

●懇親会
9月25日(火)に北見駅周辺にて懇親会を(参加費別途)予定しております.
参加人数把握の都合上,参加をご希望の方は 9月14日(金)までに下記
フォームにご回答下さい.
https://goo.gl/forms/au0HMYRzU1lfVm683

●併設イベント:
9月27日の午前に「カーリング体験会」を開催する予定ですので,奮って
ご参加下さい.
日程: 2018年9月27日 (木) 午前
会場: アドヴィックス常呂カーリングホール
http://www.okhotsk-sports-camp.jp/facility/detail.php?fcid=21
参加費:1,500円程度を予定
備考: 送迎バスを準備します.9:00 北見駅付近発〜13:00北見駅付近着
復路は女満別空港を経由します.
講師は平昌オリンピック男子代表メンバ平田洸介選手を予定しています.
– 参加ご希望の方は,以下よりお申し込み下さい.
https://goo.gl/forms/BCNiSYUPFofpwja73

●問い合わせ先:
桝井文人,プタシンスキ・ミハウ(北見工業大学)
E-mail: staff (at) mail.kitami-it.ac.jp

===============================================
プログラム
9月25日(火) 13:00-16:45 (3件+招待講演1件)
[13:00-13:15] オープニング
[13:15-14:15] 招待講演 (1件)
[14:15-14:30] 休憩
[14:30-16:00] 言語処理応用 (3件)
[18:00- ] 懇親会

9月26日(水) 10:45-16:00 (5件)
[10:45-12:15] 情報抽出・知識獲得 (3件)
[12:15-14:00] 昼休み
[14:00-15:00] 深層学習 (2件)
[15:00-15:15] クロージング

9月27日(木)9:00-13:00 カーリング体験会

9月25日(火)13:00-16:00 (3件+招待講演1件)

[13:00-13:15] オープニング

[13:15-14:15] 招待講演 (1件)

座長: 関根 聡 (理化学研究所)
(01)
オノマトペから見る言葉のあいまいさ
内田ゆず(北海学園大学)

日本語オノマトペは,現実世界の様々な事象を表現して微妙なニュアンスを
伝える際に役立つ柔軟な言葉である.また,多義性が高い,品詞が一意に
定まらないなどの特徴から,日本語表現の中でもとりわけ曖昧な語群として
知られる.さらに,新語や新用法が生まれやすいという特徴も相まって,
オノマトペは計算機での処理が難しい.本講演では,オノマトペの工学的
応用を目的として進めている分析結果について実例を交えて紹介し,言葉が
もつ曖昧さを計算機上で扱う方法を考える.

[14:15-14:30] 休憩

[14:30-16:00] 言語処理応用 (3件)

座長: 木村 泰知 (小樽商科大学)
(02)
A proposal for a unified corpus of the Ainu language
Nowakowski Karol, Ptaszynski Michal, 桝井文人(北見工大)

Ainu is an endangered language spoken in northern Japan. It has been the
subject of many studies, but most scholars work on small amounts of language
data. Also, there is no general agreement on such matters as word classes
existing in Ainu, thus various conventions for linguistic description are used. To
address that problem, we propose a corpus of Ainu covering a wide range of
documents, in a consistent structure that will enable large-scale linguistic
analysis and support the development of NLP technologies for Ainu,
contributing to the process of its revitalization. The corpus contains parallel text
in Ainu and Japanese. Its subset includes POS annotations produced by expert
linguists. For the remaining part, annotations will be generated automatically. At
present, resources collected for the corpus comprise 2M characters (428K tokens)
of text in Ainu. Their utility for NLP applications has been verified by applying
them in a tokenization system, which achieved F-score! above 95%.

(03)
Wikipedia から獲得した外部知識を用いた賛否分類
塙 一晃(東北大),佐々木 彬(リクルートテクノロジーズ),岡崎 直観(東京工大),
乾 健太郎(東北大/理研AIP)

本研究では賛否分類においてトピックに関する外部知識を利用するための手法
を提案する.Wikipedia 記事に紐づいた7トピックに関する 6,701 件のツイート
からなるデータセットを作成し,分析することで賛否分類における外部知識の
必要性が明らかとなった.また,本研究では Wikipedia 記事から獲得した知識
を賛否分類で利用するために,関連する知識を参照しながら文をエンコード
することができるモデルを提案する.Wikipedia から獲得した知識を使用する
提案手法は外部知識を使用しないものよりも高い精度で賛否の予測ができる
ことが実験結果より明らかとなった.

(04)
Androidアプリのレビューを用いたユーザーへの権限説明の補完
小島 智樹,酒井 哲也(早稲田大)

現代では、多くの人がスマートフォンを使用している。そして、それに対応
する多くのアプリケーションが公式のストアである GooglePlay などで配布
されている。アプリケーションをダウンロードするとき、ユーザは権限を求め
られる。権限とは端末のセンシティブな情報にアクセスする許可のことである。
権限はときに悪用されるため、ユーザーは権限の要求の理由がわからず、不安
を覚えることがある。本論文ではアプリケーションの権限と説明文、及び
レビューを利用し、権限の説明を補完することで不安の軽減を行う手法に
ついて提案する。

[18:00- ] 懇親会

9月26日(水)10:45-15:15 (5件)

[10:45-12:15] 情報抽出・知識獲得 (2件)

座長: ミハウ プタシンスキ (北見工業大学)
(05)
音声対話システムに向け意味属性抽出と意図タイプ推定実装小型化
米持 幸寿(ホンダ・リサーチ・インスティチュート・ジャパン)

音声対話システムの構築において, 自然言語理解 (Natural Language Under-
standing: NLU)のための固有表現 (Named Entity: NE) の抽出 (Extract) と意図の
推定 (Intent Estimation) は初歩的かつ基本的な自然言語処理である. 過去の対話
システム研究において, 日本語における形態素解析, 品詞推定, 係り受け解析,
パターンマッチングなどを様々なOSSを組み合わせることで実現している例が
多く存在する. しかし, そういったシステムは複雑かつコード量が多いという
課題も存在する. そのような特徴はオフライン小型ロボットの組み込み用途に
使う場合に障壁となる. 本研究では, プログラミング言語が標準で装備している
正規表現のみを活用することでコード量を劇的に削減した上で同等の機能を
実現する実装を試作した結果を紹介する.

(06)
依存構造に基づく単語から語義の分散表現への細分化
芦原 和樹,梶原 智之,荒瀬 由紀(大阪大),内田 諭(九州大)

多くの自然言語処理タスクにおいて単語分散表現が利用されている。しかし、
各単語に1つの分散表現を割り当てるアプローチでは、多義語における各語義
の情報が混在してしまう。この問題に対処するために、先行研究では品詞や
トピックごとに異なる分散表現を割り当てたが、これらの手法には多義性を
扱う粒度が粗いという課題がある。本研究では、単語間の依存関係を手がかり
として各単語に複数の分散表現を割り当てる手法を提案する。提案手法は、
先行研究よりも細かい粒度で多義性を扱うことができる反面、データスパース
ネス問題が危惧される。そこで我々は、多義語における各分散表現の初期値と
して、語義を区別せずに事前学習した分散表現を用いることでこの問題に対処
する。単語間の意味的類似度タスクおよび語彙的換言タスクにおける実験の
結果、提案手法は各単語に複数の分散表現を割り当てる先行研究よりも高い
性能を発揮した。また、詳細な分析の結果、初期化がデータスパースネス問題
を解決することも確認できた。

(07)
文字分散表現に基づく単語分類情報を用いたレシピ固有表現抽出
平松 淳,若林 啓(筑波大),原島 純(クックパッド)

固有表現抽出は自然言語処理の基本的なタスクの1つであり,活発に研究が行
われている.固有表現の抽出を行うためには,テキストに対して固有表現を
付与した教師データが必要である.しかし,ドメインごとに教師データを構築
することはコストが大きい.そこで,本研究では教師データだけではなく,
ドメインに関連する言語資源を利用する固有表現抽出モデルを提案する.具体
的には,文字分散表現に基づいて文中の単語を言語資源中で定めたカテゴリに
分類し,分類情報を固有表現抽出モデルの入力として利用する.このモデルに
ついて料理ドメインのデータを用いて実験し,その結果を報告する.

[12:15-14:00] 昼休み

[14:00-15:00] 深層学習 (2件)

座長: 荒瀬 由紀 (大阪大学)
(08)
構文情報を陽に与えたときの LSTM-RNN による内部表現について
岡本 千尋(東京工科大),内海 慶(デンソーアイティーラボラトリ),
持橋 大地(統計数理研)

長短期記憶リカレントニューラルネット (LSTM-RNN) は,構文情報に代表され
るような,文中の有用な長期依存関係を捉えることにより,高精度な言語モデ
ルを学習することができることが知られている.しかし逆に,一般的にどの
程度構文情報を学習できているのかや,どのように構文情報がベクトルとして
RNN内に表現されるかについては,まだ十分に研究がされていないのが現状で
ある.そこで,我々はその初歩として,英語における句構造をあらわす構文木
を線形化し文として与えて学習させたときに,RNN内で構文情報がどのように
エンコードされるかについて詳細に分析した.その結果,L1 正則化を用いる
ことで例えば RNN 内の内部ベクトルのうち少数の要素の値が,VP, N Pなど
句構造の各タグごとのネストの深さと非常に高い相関を持つこと,および,
同じく少数の要素の値から,VP, NP などの内外にいることを高精度で線形
分離できること,などがわかった.

(09)
文脈自由文法とニューラルネットワークを用いた並列構造木のCKY構文解析
寺西 裕紀,進藤 裕之,松本 裕治(NAIST)

本研究は文脈自由文法を用いて並列構造を木として導出する手法を提案する.
現在の最高精度の解析性能を達成しているニューラルネットワークによる並列
構造解析の手法は,文中の複数の並列構造や3つ以上の並列句を陽に扱って
おらず,解析結果を他のタスク等に利用することが難しい.複数の並列構造や
3 つ以上の並列句の解析を行う場合,並列構造となりうる句のスパンの組み
合わせが指数的に増加するため膨大な計算コストを要するという問題がある.
そこで本研究では並列構造を木として導出できる文脈自由文法を定義し,計算
量を抑えながら並列構造の木をボトムアップで構築する.実験の結果,提案
手法によって文中の複雑な並列構造の範囲が競合せず導出できることを保証
しながら,個々の並列構造ごとの評価において既存手法と同等以上の解析性能
を得たことを示す.

[15:00-15:15] クロージング

9月27日(木)9:00-13:00 カーリング体験会

=============================
★研究報告のペーパーレス化
本研究会はペーパーレスでの開催となり,印刷した研究報告の配布を行い
ません.また,特許出願の公知日(研究報告の公開日)が従来より1週間
早まりますので,ご留意ください.

※自然言語処理研究会に登録されている方
研究報告は研究発表会の1週間前に電子図書館と当日閲覧用サイトで公開
します.当日は資料をプリントアウトしてご持参いただくか,ご自身の
PCにダウンロードのうえ,ご持参ください.

情報処理学会電子図書館(情報学広場)
https://ipsj.ixsq.nii.ac.jp/ej/ (ユーザ登録が必要です)
当日閲覧用サイト
http://www.ipsj.or.jp/sig-reports/

※自然言語処理研究会に登録されていない方
当日受付で本研究発表会の資料閲覧用にUSBメモリを貸し出します.
当日はノートPC等をご持参ください.なお,当研究会にご登録頂くことで,
本研究会の資料をバックナンバーも含めて電子図書館で購読できます.
登録されていない方は,是非この機会に研究会に登録してください
(登録まで最大3日かかりますのでご留意ください).

★研究会への登録をお勧めします
年に2回以上の参加を見込まれる方は,研究会に登録される方が(ほぼ)
お得になります.研究会登録は以下のウェブサイトから行えます.
http://www.ipsj.or.jp/kenkyukai/toroku.html

★研究会幹事団
主査:
関根聡  (理研)
幹事:
荒瀬由紀 (大阪大学)
木村俊也 (株式会社メルカリ)
進藤裕之 (奈良先端科学技術大学院大学)
中澤敏明 (東京大学)
西川仁  (東京工業大学)
桝井文人 (北見工業大学)
横野光  (株式会社富士通研究所)
運営委員:
浅原正幸 (国立国語研究所)
荒牧英治 (奈良先端科学技術大学院大学)
石野亜耶 (広島経済大学)
内海慶  (株式会社デンソーアイティーラボラトリ)
内田ゆず (北海学園大学)
小林隼人 (Yahoo! JAPAN 研究所)
佐々木稔 (茨城大学)
笹野遼平 (名古屋大学)
貞光九月 (フューチャー株式会社)
佐藤敏紀 (LINE株式会社)
数原良彦 (Recruit Institute of Technology)
高村大也 (産業技術総合研究所/東京工業大学)
土田正明 (株式会社コトバデザイン)
徳永拓之 (LeapMind株式会社)
二宮崇  (愛媛大学)
羽鳥潤  (株式会社 Preferred Networks)
藤田早苗 (日本電信電話株式会社)
牧野拓哉 (株式会社富士通研究所)
松崎拓也 (名古屋大学)
松林優一郎(東北大学)
ミハウ・プタシンスキ(北見工業大学)
村脇有吾 (京都大学)
若木裕美 (ソニー株式会社)

===============================================