音声言語および自然言語処理シンポジウム(第254回自然言語処理研究会 )参加募集

●日程

2022年11月29日(火) 09:45 – 16:25
2022年11月30日(水) 09:30 – 17:00
2022年12月01日(木) 10:00 – 16:30

●会場

東京都港区芝公園3丁目5−8 機械振興会館 6-66会議室
http://www.jspmi.or.jp/kaigishitsu/access.html
発表は現地参加のみとさせていただいております.聴講は現地参加(人数上限あり)またはオンライン参加が可能です(ビデオ会議システムとしてZoomを利用予定).

●参加登録・現地参加登録の方法

参加登録は各研究会のページから申し込みをお願いいたします.
SLP/NL: https://www.ipsj.or.jp/member/event_moshikomi.html
SP/NLC: https://ken.ieice.org/ken/user/index.php?cmd=participation&tgs_regid=c7fb3df26b745f008b94a02648e80755c9e8750c9135b5583985212ddc9bc97b
★発表または聴講のため現地参加をご希望の方は,下記のフォームから申し込みをお願いいたします.感染防止対策のため,会場定数に達した時点で現地参加申込は締め切り,以降はオンラインでの参加をご案内します.上限に達してしまった場合にオンラインでの参加に回って頂くようお願いをする場合があります.
https://docs.google.com/forms/d/e/1FAIpQLSc1qMZ5fEXvEIKgv-YgdCu6emElxuegkv6R6XdPSCruYHdzqQ/viewform?usp=sf_link

●企画

今年も昨年に引き続き,四研究会合同プログラムを企画しております.一般セッションおよび特別セッション(音声と言語の分野横断)における21件の研究発表に加えて,合同プログラムにふさわしい招待講演セッションと国際会議参加報告セッションを予定しております.

==========================================================
11月29日(火) 13:30 – 14:15 招待講演(言語)
ドメイン言語処理でいかに戦うか:医療言語処理の現在
◯荒牧 英治(NAIST)

11月30日(水) 14:10 – 15:10 招待講演(音声(1))
雑音残響下での音声のブラインド音源分離
◯荒木 章子(NTT)

12月1日(木) 13:30 – 14:30 招待講演(音声(2))
半世紀以上も音声・聴覚を研究しているのか!? ~想定外が面白い~
◯河原 英紀(和歌山大)

==========================================================
11月30日(水) 12:30 – 13:50 国際会議参加報告(音声,言語)
国際会議INTERSPEECH2022参加報告(1)
◯佐藤 宏(NTT)
国際会議INTERSPEECH2022参加報告(2)
◯齋藤 佑樹(東大)
国際会議COLING2022参加報告
◯庵 愛(NTT)
国際会議AACL-IJCNLP2022参加報告
◯石原 祥太郎(日本経済新聞社)

また,関連イベントとして本イベントの2週間後に人工知能学会 言語・音声理解と対話処理研究会(SLUD)第96回研究会「第13回対話システムシンポジウム」が開催されます(12月13日(火),14日(木)).合わせて参加をご検討下さい.
https://jsai-slud.github.io/sig-slud/96th-sig.html

●プログラム

==========================================================
11月29日(火)
 09:45~10:00 オープニング
 10:00~12:00 Web応用
 13:30~14:15 招待講演(言語)
 14:35~16:25 音声認識(1)

11月30日(水)
 09:30~11:30 対話
 12:30~13:50 国際会議参加報告(音声,言語)
 14:10~15:10 招待講演(音声(1))
 15:30~17:00 特別セッション(音声と言語の分野横断)

12月01日(木)
 10:00~12:00 深層学習
 13:30~14:30 招待講演(音声(2))
 14:50~16:10 音声認識(2)
 16:10~16:30 クロージング

==========================================================
11月29日(火) 午前 オープニング (09:45~10:00)

−−− オープニング ( 15分 ) −−−

11月29日(火) 午後 Web応用 (10:00~12:00)

(1)/NLC 10:00 – 10:30
Link Prediction from Text Content by NLP Graph Embedding
— A Study on Chinese Journal Articles —
Tzu-Ying Yang・◯Hsuan Lei Shao・Chih-Chuan Fan・Wei-Hsin Wang(NTNU)

(2) 10:30 – 11:00
絵文字予測を感情分析の補助タスクとしたマルチタスク学習手法
□浅野 晴暉,松原 雅文 (岩手県立大)

(3) 11:00 – 11:30
メールにおける送信者署名の抽出
□藤田 正悟,高橋 寛治 (Sansan株式会社)

(4) 11:30 – 12:00
Sentence-BERTを用いたシラバスに基づく授業科目のクラスタリングと推薦
◯鈴木 大助 (北陸大)

−−− 昼食 ( 90分 ) −−−

11月29日(火) 午後 招待講演(言語) (13:30~14:15)

(5) 13:30 – 14:15
ドメイン言語処理でいかに戦うか:医療言語処理の現在
◯荒牧 英治(NAIST)

−−− 休憩 ( 20分 ) −−−

11月29日(火) 午後 音声認識(1) (14:35~16:25)

(6)/SP 14:35 – 15:05
Density Ratio Approachに基づく複数Encoder-Decoder音声認識モデル統合手法
◯北條圭悟・森 大輝・若林佑幸(豊橋技科大)・小川厚徳(NTT)・北岡教英(豊橋技科大)

(7) 15:05 – 15:35
混合ガウスモデルと特徴欠損理論に基づく短時間発話からの話者認識
◯今西 諒,川端 豪 (関西学院大)

(8) 15:35 – 16:05
内容語保存機構を備えた変分自己符号化器に基づくテキスト発話スタイル変換
□吉岡 大貴,安田 裕介 (名大),松永 悟行,大谷 大和 (株式会社エーアイ),戸田 智基 (名大)

(9) 16:05 – 16:25
二項事後分布に基づくN-gram言語モデルにおける継承係数の文脈依存性の検討
◯込山 航大,川端 豪 (関西学院大)
(ショート形式:発表10分+質疑10分)

11月30日(水) 午前 対話 (09:30~11:30)

(10)/NLC 09:30 – 10:00
雑談における機械翻訳を用いた主語の補完による話者情報の検出
◯連 慎治・伊藤敏彦・荒木健治(北大)

(11)/NLC 10:00 – 10:30
放送メタデータとユーザー生成テキストの照合のための時刻情報の扱い
◯小早川 健(NHK)・榊 剛史・大知正直・坂田一郎(東大)

(12)/NLC 10:30 – 11:00
前後文脈を用いた対話文の言い淀み検出
◯中島寛人・嶋田和孝(九工大)

(13) 11:00 – 11:30
前後の発話を文脈として考慮するニューラル音声認識誤り訂正
中村 朝陽,□李 聖民,田村 鴻希,吉永 直樹 (東大)

−−− 昼食 ( 60分 ) −−−

11月30日(水) 午後 国際会議参加報告(音声,言語) (12:30~13:50)

(14) 12:30 – 12:50
国際会議INTERSPEECH2022参加報告(1)
◯佐藤 宏(NTT)

(15) 12:50 – 13:10
国際会議INTERSPEECH2022参加報告(2)
◯齋藤 佑樹(東大)

(16) 13:10 – 13:30
国際会議COLING2022参加報告
◯庵 愛(NTT)

(17) 13:30 – 13:50
国際会議AACL-IJCNLP2022参加報告
◯石原 祥太郎(日本経済新聞社)

−−− 休憩 ( 20分 ) −−−

11月30日(水) 午後 招待講演(音声(1)) (14:10~15:10)

(18) 14:10 – 15:10
雑音残響下での音声のブラインド音源分離
◯荒木 章子(NTT)

−−− 休憩 ( 20分 ) −−−

11月30日(水) 午後 特別セッション(音声と言語の分野横断) (15:30~17:00)

(19)/SP 15:30 – 16:00
音声合成と音声認識に対するテキストデータを用いた半教師あり統合学習
◯牧島直輝・鈴木聡志・安藤厚志・増村 亮(NTT)

(20)/SP 16:00 – 16:30
どう言ったかを何を言ったかで表す ~ フォーカスを含んだ発話及びその含意を反映したテキストを含む英語コーパス ~
◯鱸 尚晃・中村 哲(奈良先端大)

(21) 16:30 – 17:00
声を含むデータベースの「使いやすさ」に関する一考察 ~No.7音声・歌唱データベース構築を実例として~
◯森勢 将雅 (明治大)
(ディスカッション形式:発表10分+質疑20分)

12月1日(木) 午前 深層学習 (10:00~12:00)

(22) 10:00 – 10:30
日本語 PromptBERT におけるプロンプトベース対照学習の有効性とプロンプトの性質の調査
□芝山 直希 (茨城大),古宮 嘉那子 (農工大),新納 浩幸 (茨城大)

(23) 10:30 – 11:00
言語モデルの第二言語獲得効率
□大羽 未悠 (NAIST),栗林 樹生 (東北大/Langsmith株式会社),大内 啓樹 (NAIST/理研),渡辺 太郎 (NAIST)

(24) 11:00 – 11:30
(発表キャンセル)

(25) 11:30 – 12:00
(発表キャンセル)

−−− ※本セッションは2件キャンセルがありましたので,11:00までとなります. −−−

−−− 昼食 ( 90分 ) −−−

12月1日(木) 午後 招待講演(音声(2)) (13:30~14:30)

(26) 13:30 – 14:30
半世紀以上も音声・聴覚を研究しているのか!? ~想定外が面白い~
◯河原 英紀(和歌山大)

−−− 休憩 ( 20分 ) −−−

12月1日(木) 午後 音声認識(2) (14:50~16:10)

(27)/SP 14:50 – 15:20
A Japanese Automatic Speech Recognition System on the Next-Gen Kaldi Framework
◯Wen Shen Teo・Yasuhiro Minami(UEC)

(28)/SP 15:20 – 15:50
Domain and language adaptation of large-scale pretrained model for speech recognition of low-resource language
◯Kak Soky(Kyoto University)・Sheng Li(NICT)・Chenhui Chu・Tatsuya Kawahara(Kyoto University)

(29)/SP 15:50 – 16:10
大規模音声データのみ獲得できる環境下への音声認識モデルのドメイン適応
◯木内貴浩・森 大輝(豊橋技科大)・小川厚徳(NTT)・北岡教英(豊橋技科大)

12月1日(木) 午後 クロージング (16:10~16:30)

−−− クロージング ( 20分 ) −−−

□:NL研の若手奨励賞選奨対象者
◯:その他

一般講演:発表 20 分 + 質疑応答 10 分
一般講演(ショート形式):発表 10 分 + 質疑応答 10 分
一般講演(ディスカッション形式):発表 10 分 + 質疑応答 20 分

協賛:
◆IEEE Signal Processing Society Kansai Chapter
◆IEEE Signal Processing Society Sendai Chapter
◆IEEE Signal Processing Society Tokyo Chapter
◆APSIPA Japan Chapter

●本シンポジウムに関する問い合わせ先

(SP/SLP) 増村 亮(日本電信電話株式会社)
(NLC) 光田 航(日本電信電話株式会社),小早川 健(NHK)
(NL) 萩行 正嗣(株式会社ウェザーニューズ)
nl-sympo@googlegroups.com宛のメールは,上記の幹事団全員に届きます.

●研究会一覧

★言語理解とコミュニケーション研究会(NLC)
専門委員長 吉田 光男 (筑波大) 
副委員長 坂地 泰紀 (東大), 小早川 健 (NHK)
幹事 光田 航 (NTT), 石野 亜耶 (広島経済大)
幹事補佐 高橋 寛治 (Sansan), 小川 泰弘 (名大)

★音声研究会(SP)
専門委員長 戸田 智基 (名大)
幹事 増村 亮 (NTT), 中鹿 亘 (電通大)
幹事補佐 相原 龍 (三菱電機), 齋藤 大輔 (東大)

★自然言語処理研究会(IPSJ-NL)
主査 須藤 克仁 (奈良先端科学技術大学院大学)
幹事 内海 慶 (株式会社デンソーアイティーラボラトリ), 内田 ゆず (北海学園大学), 古宮 嘉那子 (東京農工大学), 萩行 正嗣 (株式会社ウェザーニューズ), 吉永 直樹 (東京大学), 吉野 幸一郎 (理化学研究所)

★音声言語情報処理研究会(IPSJ-SLP)
主査 戸田 智基 (名古屋大学)
幹事 増村 亮 (NTT), 中鹿 亘 (電気通信大学), 相原 龍 (三菱電機), 齋藤 大輔 (東京大学)

音声言語および自然言語処理シンポジウム(第254回自然言語処理研究会 )発表募集

第24回音声言語シンポジウム(SP/SLP)兼第9回自然言語処理シンポジウム(NLC/NL)を11月29日(水)~12月1日(金)に開催します.今回は2年ぶりに現地開催をベースとしたハイブリッド形式となります.

1999年より開催されている音声言語シンポジウムと,2014年から行っている自然言語処理シンポジウムの合同シンポジウムとなっている本シンポジウムでは,毎年,音声言語および自然言語処理に関する招待講演等の企画と多くの一般発表が行われ,盛況なイベントとなっています.皆さまからの投稿を心よりお待ちしています.

★今回の音声言語・自然言語処理シンポジウムでは,新しい試みとして,通常の一般セッションに加えて特別セッション「音声と言語の分野横断」を新設し,発表を募集します.特別セッション中の発表のみを対象にした選奨も行います.

●日程: 2022年11月29日(火),30日(水),12月1日(木)
発表件数に応じて2日間または3日間開催とし,11月29日(火)は予備日です.

●会場: 東京都港区芝公園3丁目5−8 機械振興会館 6-66会議室
★発表は現地参加のみとさせていただきますが,リアルタイムのオンライン配信を行うため,聴講および質問はオンライン参加でも可能です(ビデオ会議システムとしてZoomを利用予定).

●発表申込締切: 2022年10月11日(火)

●原稿締切: 2022年10月27日(木)※ 厳守
大変恐縮ですが,一部のメーリングリストにて10月28日(金)と記載されたCFPが送付されておりますが,正しくは10月27日(木)が原稿〆切となります.

●主催
 電子情報通信学会および日本音響学会 音声研究会(SP)
 電子情報通信学会 言語理解とコミュニケーション研究会(NLC)
 情報処理学会 音声言語情報処理研究会(SLP)
 情報処理学会 自然言語処理研究会(NL)

●協賛
 IEEE Signal Processing Society Kansai Chapter
 IEEE Signal Processing Society Sendai Chapter
 IEEE Signal Processing Society Tokyo Chapter

今年も昨年に引き続き,四研究会合同プログラムを企画しております.また,それにふさわしい招待講演セッション(今年度の新たなIEEE Fellowの記念講演等)を予定しております.

音声認識・音声合成・音声対話・感情音声・音声インタラクション・音声分析・対話言語処理・応用システムなど,音声言語処理に関する幅広い分野の発表,また,自然言語処理の学術的な発表をはじめ,テキストアナリティクスの応用事例や,今後の研究提案や問題提起などのポジションペーパーまで自然言語処理についても広く募集します.研究のスタートアップ段階の発表も歓迎です.

また,関連イベントとして本イベントの2週間後に人工知能学会 言語・音声理解と対話処理研究会(SLUD)第96回研究会「第13回対話システムシンポジウム」が開催されます(12月13日(火),14日(木)).合わせて参加をご検討下さい.
https://jsai-slud.github.io/sig-slud/96th-sig.html

●発表形態: 口頭発表(詳細については追ってご連絡いたします)
★発表は現地参加のみとさせていただきます.
※ リアルタイムのオンライン配信を行うため,聴講および質問はオンライン参加でも可能です(ビデオ会議システムとしてZoomを利用予定).

※ 発表時間の調整について
従来の一般講演形式に加えてショート形式(発表時間全体を短かくしたもの),討議形式(発表時間を短かくし,質疑時間を長くしたもの)など,発表者からの要望に応じて発表時間を調整します.アイデアレベルの研究の紹介や,研究の詳細まで話したいので時間がほしい,などの要求を発表申込の備考欄にご記入いただければ,それらを考慮してプログラムを作成します.ぜひご活用ください.

★特別セッション「音声と言語の分野横断」での発表を希望する場合は,各研究会における発表申込の際に,研究会所定の方法で申告をお願いします.プログラム作成および選奨に利用します.

●特別セッション:「音声と言語の分野横断」
本特別セッションでは,音声と言語の両分野にまたがって,単一のモーダルに留まらない情報を扱った研究発表を広く募集します.音声認識,音声合成,音声対話,音声翻訳,音声と言語の双方を含むコーパスの構築や分析等,音声と言語の両分野をカバーする研究を分野に限らず幅広く募集します.

★ 音声と言語の分野横断的研究を奨励することを目的とし,新しく特別セッションを対象とした選奨を設けます.本選奨は各研究会が個々に設けている選奨とは独立に行い,本シンポジウムにおける特別セッションの発表のみを対象とします.

●発表申込先
SP,SLP,NL,またはNLC研究会へ発表申込を行います.それぞれの研究会の発表申込方法は以下をご覧ください.

●SP・NLCへ申し込みの方はこちら
発表申込みは,電子情報通信学会 研究会発表申込システム
SP研究会: http://www.ieice.org/ken/program/index.php?tgid=SP
NLC研究会: http://www.ieice.org/ken/program/index.php?tgid=NLC
より,開催回の「発表申込受付中」リンクからご記入・送信ください.
研究会への投稿に関するご案内・方法・FAQ は
https://www.ieice.org/jpn/kenkyuukai/toukou.html
にございますので合わせてご覧ください.

SP/NLC研究会では,発表の予稿は6ページ以内,日本語・英語いずれによる記述も可です.

○音声研究会では若手研究者(35才以下)の優秀発表に対して,音声研究会研究奨励賞を設けさせていただいております.2019年度末時点で35才以下の発表者(第一著者)の方は,音声研究会研究奨励賞の選奨対象となります.選奨対象である場合は,上記申込システムによる入力時,研究会アンケートの研究奨励賞の欄にチェックを入れて下さい.

○NLC研究会へ申し込まれた場合は,NLC研究会2022年の優秀研究賞・学生研究賞の選考対象となります.

●SLP・NLへの申し込みの方はこちら
SLP:https://ipsj1.i-product.biz/ipsjsig/SLP/
NL:https://ipsj1.i-product.biz/ipsjsig/NL/
(研究会ホームページからもアクセスできます)

○SLP研究会企業賞
本研究会のダイヤモンドレベル企業スポンサー名をお借りして,1月〜12月までに行われた研究会で業績の優れた発表,あるいは将来性のある発表を行った学生に企業賞を授与します.選考対象となるのは,以下の発表です.SLP研究会に第1著者として発表を申し込み,発表時において博士学生,修士学生,もしくは学部生であり,当日実際に発表を行った者.
詳細URL: http://www.ipsj.or.jp/award/slp-award2.html選考対象となる場合は【研究会への連絡事項】の欄へ「SLP研究会企業賞対象発表」と記入してください.
※さらにSLPへ申し込まれた場合は,自動的に山下記念研究賞の選奨対象となります.

○優秀研究賞(NL研のみ)
研究会に投稿された予稿の中から特に優れたものを優秀研究賞として表彰する予定です.

○若手奨励賞(NL研のみ)
年度開始時点(4月1日)で30歳未満,あるいは学生(社会人博士含む)方を対象と して,研究会参加者の投票によって選考します.

●参加費について
SP/SLP/NL/NLCは共催・連催となっておりますが,プログラム上は混合です.申込先または主目的で参加する1つの研究会の参加費をお支払いいただければ,すべてのプログラムに参加可能です.
※電子情報通信学会の申し込みサイトには,「掲載料」との記述がある場合がありますが,掲載料はかかりません.ただし,当日参加される発表者にも参加費をお支払い頂きます.
なお,何らかの事情でWeb からのお申込みができない場合は,問い合わせ先まで E-mail でご連絡下さい.

●本シンポジウムに関する問い合わせ先:
(SP/SLP) 増村 亮(日本電信電話株式会社)
(NLC) 光田 航(日本電信電話株式会社),小早川 健(NHK)
(NL) 萩行 正嗣(株式会社ウェザーニューズ)
nl-sympo@googlegroups.com宛のメールは,上記の幹事団全員に届きます.

第227回自然言語処理研究会 (SIG-NL) 参加募集

ライブ配信

http://www.ustream.tv/channel/ipsj-signl

開催概要

◎日程:2016年7月29日(金)30日(土)

◎会場:岡山県立大学
〒719-1197 岡山県総社市窪木111
アクセスマップ: http://www.oka-pu.ac.jp/index.php?page_id=1150
教室(予定)
29日(金) 学部共通棟(東)8904
30日(土) 学部共通棟(東)8901
キャンパスマップ http://www.oka-pu.ac.jp/index.php?page_id=1230

◎交通アクセス:
・JR桃太郎線・服部駅から徒歩5分
・JR倉敷駅からJR総社駅経由で約40分
※桃太郎線は便が少ないのでアクセスの際はお気をつけ下さい
※備中高松は服部駅2つ前までなのでお気をつけ下さい

◎注意事項
・学校の周りに飲食店がほとんどないため昼食は学食でとっていただくか、
持参していただくようにおねがいします.
・特に30日(土)は学食がやっていないので、昼食はご持参していただくように
 お願いします.
・1kmぐらい離れたところにセブン-イレブンやラーメン屋等があります.
・開催中の27日〜29日まで中国インターハイが開催され、皇族の方も出席されるそうなので、
  ホテルや鉄道がの混雑が予想されます. 早めのご予約をお願いします.
============================

懇親会

当日は懇親会を予定しておりますので、ぜひご参加ください。
※下記「事前申込」から申し込みをお願いします。

・日時:2016年7月29日(月)18時30分〜
・会場:岡山駅付近で実施予定
・事前申込:http://goo.gl/forms/sb2zOpuZqe42Zxan2
・申込締切:2016年7月18日(月)
・会費:4,000円前後(予定)
============================

照会先

●研究会に関する問い合わせ先:
NL研に関する照会先: 木村 俊也(株式会社ミクシィ)
E-mail: shunya.kimura (at) mixi.co.jp

会場に関する照会先: 菊井 玄一郎, 磯崎 秀樹 (岡山県立大学)
E-mail: {kikui, isozaki} (at) cse.oka-pu.ac.jp

============================

プログラム(発表件数16件)

7月29日(金)
[13:30-15:30] 構文解析・意味解析・評判分析 [4件]
[15:30-15:45] 休憩
[15:45-17:15] 言語処理応用 [3件]
[18:30-] 懇親会

7月30日(土)
[09:30-11:00] 機械翻訳 [3件]
[11:00-12:00] 招待講演 [1件]
[12:00-13:30] 昼休み
[13:30-14:50] 言語分析・言い換え [3件]
[14:50-15:05] 休憩
[15:05-16:35] Twitter分析 [3件]
[16:35-16:50] クロージング

—————————-
7月29日(金)

[13:30-15:30] 構文解析・意味解析・評判分析 [4件]
座長:ニュービッグ グラム (奈良先端科学技術大学院大学)

(01) K-best反復ビタビパージング
林 克彦, 永田 昌明 (NTTコミュニケーション科学基礎研究所)

本稿では確率文脈自由文法に対する効率的,かつ,解の最適性を保証するパージングアルゴリズムを提案する.
また,提案手法を拡張して,K-best解を効率的に求めるための手法についても提案する.英語ペンツリーバン
クを使った実験から,提案手法が従来手法も高速に動作することを示す.

(02) 点推定による日本語 all-words WSD システム KyWSD
新納 浩幸, 古宮 嘉那子, 佐々木 稔 (茨城大学), 森 信介 (京都大学)

ここでは我々が公開している日本語の all-words WSD システム KyWSD を紹介する。KyWSD は点推定を基
本にした単語分割学習システム KyTea を利用したものであり、その拡張性に特徴がある。all-words WSD は
現実の意味解析にとって必須の技術である。また様々な NLP タスクの学習システムに対して、 KyWSD は語義
の素性を追加することができる。更に KyWSD は日本語 WSD システムのベースラインとして手軽に利用でき
る。これらの点から KyWSD は役に立つと考えている。またここでは KyWSD の精度や拡張性を調べた。その
実験から KyWSD 及び日本語の all-words WSD の持つ問題点も示す。

(03) 極性辞書を利用した句構造による注意型ニューラル評価極性分類
宮崎 亮輔, 小町 守 (首都大学東京)

評価文の中では,評価極性(ポジティブ・ネガティブ)を反転させるような表現を含むことがあるが,このよう
な現象を単語のみから捉えることは難しく,この問題を解決するためには統語的構造を考慮する必要がある.構
文木を利用した方法はこれまでにも考えられているが,ノードやエッジを用いたスパースな素性を設計する必要
がある.素性のスパース性を解消するために再帰的ニューラルネットによる手法も提案されているが,文単位の
評価極性分類で既存の手法と同程度以上の性能を得るためには部分フレーズ毎に極性アノテーションされたコー
パスが必要である.各部分フレーズに人手でアノテーションを行うことはコストが高く,現在は英語などでの限
られた言語でしか利用可能なコーパスが存在しない.また極性分類に影響するフレーズや単語は文内でも一部分
だけであり,再帰的ニューラルネットワークにおいて木構造上で遠い位置にある重要なフレーズや単語の情報を
ロスなくルートまで伝達するのは難しい.そこで,極性辞書と注意機構を利用した再帰的ニューラルネットワー
クによるモデルを提案する.提案手法では,極性辞書による部分アノテーションと各部分フレーズを重み付きで
考慮する注意機構を再帰的ニューラルネットワークの一種である木構造LSTMへ適用した.実験の結果,提案手法
が日本語の評価極性分類において最高精度を示した.

(04) Characterを用いたSNS文章分類
清水 隆範, 劉 牧 (株式会社ソニー・インタラクティブエンタテイメント)

近年,SNS は顧客の声を直接的に理解する上で重要なツールとなっている.SNS分析の中に,Sentiment,
Emotionなど分類する言語処理技術が必要である.普通的に,日本語の分類はまず形態素分析を行い単語分割
し,後はLexiconそれども学習した分類モデルを利用して分類する.本稿では,形態素分析を行わず文章から単
語を分離せずに,文章から文字を分離しベクトル化して,文字ベースの文章特徴化である.評価実験では,日本
語,英語ツイートのSentiment分類,中国語Weiboデータのsubjectiveとobjective分類,日本語文章歪み耐性
実験を行い,文字ベースの有効性を示し,その適用が期待できる

[15:30-15:45] 休憩

[15:45-17:15] 言語処理応用 [3件]
座長:磯崎 秀樹 (岡山県立大学)

(05) Encoder-Decoderモデルにおける出力長制御
菊池 悠太, ニュービッグ グラム, 笹野 遼平, 高村 大也, 奥村 学 (東京工業大学)

機械翻訳に初めて適用されて以降,Encoder-Decoderモデルの枠組みは様々なタスクに転用され多くの注目を
集めている.このとき出力系列の長さを直接制御する試みは行われておらず,言語モデルであるDecoderに依
存していたが,要約のように出力長を外部から制御できることが重要であるタスクも存在する.そこで本研究で
は文要約タスクを対象に,指定した長さに応じた要約を出力させるための手法を提案する.

(06) 業績変動を考慮した決算短信からの重要文抽出
磯沼 大, 藤野 暢, 浮田 純平, 村上 遥, 森 純一郎, 坂田 一郎 (東京大学)

近年,記事生成などへの自動要約技術の適用が注目されている.本研究で対象とする決算記事は,どの事業や事
象が企業全体の業績変動に大きな影響を及ぼすかといった記者の知見をもとに作成される.したがって自動要約
においてはこうした記者の知見を抽出し,情報抽出・要約に適用する技術が必要である.本研究では過去の決算
短信と決算記事から業績変動と短信文の掲載パターンを学習し,記事に掲載されるべき文を決算短信から抽出す
る手法を提案する.提案手法は2パートに分かれ,第1パートでは各事業セグメントの業績変動と,記事掲載パ
ターンを学習することにより,掲載されるべき事業セグメントを判定する.第2パートでは判定された事業セグ
メントの業績要因文について,極性判定により各文の重要度を評価し,抽出を行う.極性判定では,決算記事中
の各表現に関する極性を自動で獲得し,NMFによる極性値推定を行うことで,決算記事に未出現の表現も含め
た多様な表現に関する極性の獲得を可能にした.提案手法を適用して決算短信から抽出された文と実際の決算記
事を比較した実験において,重要文抽出精度の評価を行い提案手法の有効性を確認した.

(07) 誤りの傾向と文の容認性に着目した英作文のレベル判定
林 正頼, 笹野 遼平, 高村 大也, 奥村 学 (東京工業大学)

英語教育において,学習者が書いた英作文が,どの程度のレベルなのかを把握することは,教育者,学習者双方
にとって重要である.本研究では,学習者が書いた英作文を対象に,語彙情報といった基本的な素性に加え,文
中に含まれる誤りの傾向や,文の容認性などに着目し,英作文のレベルを自動的に判定するシステムの構築を目
指す.

[18:30-] 懇親会

—————————-
7月30日(土)

[09:30-11:00] 機械翻訳 [3件]
座長:岡崎 直観 (東北大学)

(08) 和訳の自動評価のための係り受け木の比較
門田 悠一郎, 磯崎 秀樹 (岡山県立大学)

翻訳の質の良し悪しを自動的に評価する翻訳自動評価手法は、機械翻訳の発展に不可欠である。語順の近い欧米
言語間ではIBMのBLEUが採用されているが、英語と日本語のように語順が大きく入れ替わる言語対では、
BLEUと人手評価の相関が低い。そこで磯崎らは、語順の類似度を利用するRIBESを考案した。RIBESは人手評
価との相関が高いが、語順を利用しているので、日本語のスクランブリング現象と相性が悪い。本稿では、高地
と磯崎によって考案された「係り受け比較法」を紹介し、RIBESとWERで文レベル相関がどう改善されるかを
示す。

(09) 木構造を中間表現とするピボット翻訳手法
三浦 明波, ニュービッグ グラム, 中村 哲 (奈良先端科学技術大学院大学)

統計的機械翻訳において,特定の言語対で十分な文量の対訳コーパスが得られない場合,中間言語を用いたピボ
ット翻訳が有効な手法の一つである.ピボット翻訳手法の中でも,特に中間言語を介する2つの翻訳モデルを合
成するテーブル合成手法で,高い翻訳精度を得られることが知られている.しかし,従来のテーブル合成手法で
は,フレーズペアの中間言語側の単語列一致をもとに新しい翻訳規則を推定するが,多品詞語などの影響で曖昧
性が高く,誤った規則に高い翻訳確率が推定されてしまう問題がある.そこで,本研究ではフレーズの構文構造
が一致する場合のみフレーズペアを結び付けるという条件を導入し,曖昧性解消に取り組む.このようにして得
られる翻訳モデルは高信頼度だがカバレッジを損なうことが考えられるため,従来モデルも併用することで信頼
度とカバレッジを両立する手法も提案する.本手法の有効性を評価するため,国連文書コーパスを用いた多言語
翻訳の実験で精度の比較を行った.

(10) 動画像情報と音声情報のシーケンス変換学習に基づく言語獲得
高渕 健太, 岩橋 直人, 國島 丈生 (岡山県立大学)

本研究では,動画像情報と音声情報のシーケンス変換学習に基づくロボットの言語獲得手法を提案する.提案手
法では,概念構造を表す記号列と音節列の相互変換を学習する.シーケンス変換学習として統計的機械翻訳手法
であるIBM Model4とニューラルネットワークに基づく機械翻訳手法であるEncoder-decoderモデルの2通り
を試す.本提案手法の特徴は以下の2点である.1)動画像情報と音声情報の変換の学習を機械翻訳問題としてモ
デル化する.2) 形態素解析を必要とせず,音節列と概念構造を変換することができる.実験により,高い精度
で動画像情報と音声情報が相互変換できることを確認した.

[11:00-12:00] 招待講演 [1件]

(11) 自然言語処理における深層学習の省メモリ化と高速化
進藤 裕之 (奈良先端科学技術大学院大学)
座長:乾 健太郎 (東北大学)

[12:00-13:30] 昼休み

[13:30-14:50] 言語分析・言い換え [3件]
座長:林 克彦 (NTTコミュニケーション科学基礎研究所)

(12) 単語分散表現のアライメントに基づく文間類似度を用いたテキスト平易化のための単言語パラレルコーパスの構築
梶原 智之, 小町 守 (首都大学東京)

統計的機械翻訳の枠組みを用いたテキスト平易化が近年活発に研究されているが、その学習に必要な単言語パラ
レルコーパスを人手で構築することはコストが高い。そのため、テキスト平易化のための単言語パラレルコーパ
スは、英語や独語など限られた言語でしか整備されていない。本稿では、単語の分散表現に基づいて計算される
文間類似度を用いて、テキスト平易化のための単言語パラレルコーパスを自動構築する手法を提案する。我々は
難解な文と平易な文からなる任意の文対に対して、一方の文中の各単語に対して最も類似度の高い他方の文中の
単語を割り当てる多対一の単語アライメントを考え、それらの単語間類似度の平均値によって文間類似度を定義
する。我々の提案手法は、ラベル付きデータや辞書などの外部知識を必要としないため、任意の言語に適用でき
る。実験の結果、我々の提案手法は英語のテキスト平易化のための単言語パラレルコーパスの自動構築タスクに
おいてstate-of-the-artを更新した。また、統計的機械翻訳の枠組みを用いたテキスト平易化の実験結果も、
我々の提案手法によって構築されたコーパスが既存のテキスト平易化のためのコーパスよりも優れていることを
示した。本研究ではテキスト平易化を対象にしたが、単言語パラレルコーパスは言い換えや文圧縮などの分野で
も有用な言語資源である。

(13) NTCIR-12 QA Lab-2におけるQAシステムの課題—センター試験の結果を中心として
渋木 英潔 (横浜国大大学), 石下 円香 (国立情報学研究所), 阪本 浩太郎 (横浜国立大学), 藤田 彬 (国立情報学研究所), 狩野 芳伸 (静岡大学), 三田村 照子 (カーネギーメロン大学), 森 辰則 (横浜国立大学), 神門 典子 (国立情報学研究所)

現実世界を対象とした質問応答の実現に向けて,大学入試問題を解くことを目的としたQA Labタスクを
NTCIR-11および-12で行った.本論文では、過去2回のQA Labにおいて多肢選択型のタスクに参加したシステ
ムの結果を用いて、多くの参加システムが解けなかった問題を対象とした誤り分析を行い、今後の質問応答シス
テムに要求される知識や処理を考察する.

(14) (ショート発表) 再帰的評価を利用した講義アンケートの単語・コメント評価
塩飽 朝美, 椎名 広光 (岡山理科大学), 小林 伸行 (山陽学園大学)

現在、各大学ではFD活動の一環として講義アンケートを実施し、教員や講義に対する学生の満足度等を調査す
ることで教育や講義改善を図っている。本研究では、講義アンケートの自由回答欄のコメントを対象にコメント
とそれに含まれる単語の評価推定を行う。コメントの評価方法として、一部コメントの複数人による評価に対し
てコメントと単語のそれぞれの評価推定を相互に再帰的に繰り返し、全コメントの評価推定を行う。また、個々
人によるコメントと単語の推定評価の相違を評価する。

[14:50-15:05] 休憩

[15:05-16:35] Twitter分析 [3件]
座長:木村 俊也 (株式会社ミクシィ)

(15) 重み付き木構造カーネルと共起重みによるTwitterの自動分類手法
武田 昌大, 椎名 広光 (岡山理科大学), 小林 伸行 (山陽学園大学)

Twitter等のWebサービスの充実により,コメントデータを様々なカテゴリや粒度に自動分類する技術の要求が
高まっている.そこで本研究では、Wikipediaのカテゴリ構造を応用することで、文に対して多様なカテゴリの
意味を抱負した木構造による素性を生成し、文と文の距離を計算する手法を提案する.また木構造におけるカテ
ゴリ間ノードや共起語に対する重み付けによる改良により、分類精度の向上を図った.

(16) Twitterの利用状況とツイートの印象に関する分析
熊本 忠彦 (千葉工業大学)

本稿では,アンケート調査に基づいてTwitterの利用状況やメリット・デメリット,Twitterを利用している理由
などを調べるとともに,Twitterの閲覧頻度が一定以上のヘビーユーザに対し,ツイートからどのような印象を
受けたことがあるか,どのような印象のツイートを見たいか,あるいは見たくないかを尋ね,その結果をタイプ
分類した.さらに,ツイートの印象を「感情属性」というタイプに分類された24個の印象語を用いて評価して
もらうというアンケート調査を行い,その結果得られた印象評価データに対し因子分析やクラスタ分析を行うこ
とで,印象語どうしの関係を調べ,ツイートの印象を表すのに適したツイート印象軸を設計した.

(17) 複数時点の単語出現頻度を扱う時系列データモデリング
磯 颯, 若宮 翔子, 荒牧 英治 (奈良先端科学技術大学院大学)

インフルエンザをはじめとする感染症に関する迅速な情報収集は公共衛生上重要な課題である. 本研究では,
Twitterにより得られたデータを用いてインフルエンザ流行の現状把握,および,患者数の予測を行う. 従来法
では,対象時点の少数の単語頻度データのみを扱うものが多かったのに対し,本研究では,対象時点のツイート
に制限しない,多時点の単語頻度データからインフルエンザの患者数の現状把握モデルを構築し,予測モデルへ
の拡張を行う. この拡張は,感染症の早期検出に制限されるものではなく,より広範な時系列データに応用可
能である. 実験の結果,1週間先の患者数を予測した場合,実際の患者数との相関の平均は0.928となった.ま
た,2週間先の患者数を予測した場合,相関の平均は0.872となり,実用的にも有用なモデルを構築できたので
報告する.
[16:35-16:50] クロージング

============================
研究会幹事団
主査:
乾健太郎 (東北大学)
幹事:
荒瀬由紀 (大阪大学)
岡崎直観 (東北大学)
木村俊也 (株式会社ミクシィ)
小町守  (首都大学東京)
西川仁  (東京工業大学)
運営委員:
浅原正幸 (国立国語研究所)
荒牧英治 (奈良先端科学技術大学院大学)
石野亜耶 (広島経済大学)
金丸敏幸 (京都大学)
小林隼人 (Yahoo! JAPAN 研究所)
古宮嘉那子(茨城大学)
貞光九月 (日本電信電話株式会社)
佐藤敏紀 (LINE株式会社)
新里圭司 (株式会社楽天)
鈴木祥子 (日本アイ・ビー・エム株式会社)
数原良彦 (リクルートホールディングス)
高村大也 (東京工業大学)
土田正明 (日本電気株式会社)
堂坂浩二 (秋田県立大学)
徳永拓之 (スマートニュース株式会社)
二宮崇  (愛媛大学)
橋本力  (独立行政法人 情報通信機構)
藤田早苗 (日本電信電話株式会社)
牧野貴樹 (グーグル株式会社)
牧野拓哉 (株式会社富士通研究所)
松崎拓也 (名古屋大学)
ミハウ・プタシンスキ(北見工業大学)
村脇有吾 (京都大学)
若木裕美 (株式会社東芝)
Kevin Duh (Johns Hopkins University)