第244回自然言語処理研究会 参加募集

●日程: 2020年7月3日(金) (1日のみの開催に変更しました)

●会場: オンライン (Zoom, 12:45頃~)

●参加申込:

参加を希望される方は情報処理学会マイページから参加申込をお願いいたします(当日でも申込可能).非会員の方もマイページを開設してお申し込みください.参加申込をしていただくと,会場のURL情報や研究報告のダウンロード方法を記載したメールをお送りします.参加費無料の研究会登録会員/ジュニア会員も,URLの取得と参加者数の把握のため,マイページより参加申込をしてくださいますようお願いいたします.

●参加費:
NL研究会登録者:無料
情報処理学会ジュニア会員:無料
情報処理学会正会員、賛助会員、名誉会員:1,500円
情報処理学会学生会員:500円
情報処理学会非会員(一般):2,500円
情報処理学会非会員(学生):2,500円

●問い合わせ先:
笹野遼平 (名古屋大学, sasano(at)i.nagoya-u.ac.jp)

===========
7月3日(金) 発表6件
[13:00-14:30] 対話・議論 (3件)
[14:30-14:45] 休憩
[14:45-16:15] 埋め込み表現・推論 (3件)
[16:15-16:20] クロージング

若手奨励賞の対象者には著者名の前に「〇」を付けています.

7月3日(金) 発表6件
[13:00-14:30] 対話・議論 (3件)

(1)  自動対話システムの不適切発話の分析とその回避

〇 新 隼人 (京都大学), 坂田 亘 (LINE株式会社), 田中 リベカ, 黒橋 禎夫 (京都大学)

タスク志向の自動対話システムであってもユーザが雑談のような発話を入力することは少なくない。特に自治体などが運営する公的な対話システムにおいては、それに対して不適切な応答を行わないようにすることは重要である。本研究では、実サービスのクエリログおよびクラウドソーシングで集めたデータを利用して、対話システムの不適切発話の調査を行った。調査を基に不適切発話を「品行方正でない発話」、「システムの設定を逸脱した内容の発話」の2つに分類し、それらに対するフィルタリング手法を提案した。さらに、Twitterから収集したデータにフィルタリングを適用し、得られたデータで対話システムを学習した。その結果、ベースラインに比べて品行方正でない発話が減少し、システムの設定の逸脱も見られなくなった。

(2) Graph Attention NetworkによるArgumentationのコンポーネント分類

〇 鈴木 祥太, 伊藤 孝行 (名古屋工業大学)

議論マイニングはArgumentationを解析し,その構造を特定することを目的とする.議論マイニングにおいて,コンポーネント分類は重要な課題である.コンポーネント分類を行うため,既存の手法は,複雑な議論構造をベクトルのような簡単な表現の特徴量に変換する.しかしながら,これらの特徴量に基づく手法では,複雑な構造を扱う上で貴重な情報が失われると考えられる.この問題を解決するため,本稿では,議論構造を直接的に学習することで,コンポーネント分類を行う手法を提案する.議論構造を直接的に学習するために,提案手法はGraph Attention Networkを用いる.提案手法を評価するため,評論のコーパスを用いて実験を行った.実験の結果,提案手法は既存の特徴量に基づく手法よりも正確にコンポーネント分類を行うことが示された.

(3) 対話によって曖昧性解消を行う質問応答

〇 中野 佑哉 (奈良先端科学技術大学院大学/理化学研究所), 河野 誠也 (奈良先端科学技術大学院大学), 吉野 幸一郎, 中村 哲 (奈良先端科学技術大学院大学/理化学研究所)

質問応答とは,与えられた質問に対し適切な答えを見つけて提示するタスクであり,機械読解や対話システムなど様々な応用を構成する重要な基本タスクの一つである.これまでの質問応答システムの研究は様々な問題を解決し,いくつかのベンチマークで高い精度を実現してきた.しかしながら,質問応答システムを実際に利用する場合,様々な課題が残されている.その中の一つに,質問応答システムに対するユーザ発話の曖昧性がある.本論文では,解答が一意に定まらない曖昧な質問文に対し,問い返しを行うことによって質問文の意味を一意に定めることを目的とする新たな質問応答タスクを設定した.その上で,この問題のベンチマークとなる質問応答データセットを既存の質問応答タスク向け大規模データセットから変換することにより作成した.また,作成したデータセットに対して既存モデルを用いた際の精度評価実験を行い,どのような問題が存在するか議論した.

[14:45-16:15] 埋め込み表現・推論 (3件)

(4) BERTの教師無しデータへの適用

築地 毅, 鈴木 晴也, 柴原 一友, 藤本 浩司 (テンソル・コンサルティング株式会社), 池田 龍司, 尾﨑 和基, 森田 克明, 松原 敬信 (三菱重工業株式会社)

本稿では,BERTを利用した教師無しデータへの適用について論ずる.近年ディープラーニングの技術が確立し始めており,特に画像認識分野において,既存の技術では困難だった特徴の自動抽出を実現したことにより,非常に高い精度を上げるようになってきている.自然言語処理においてもディープラーニングの研究は広く行われているが,近年Googleにより発表されたBERTの功績は大きく,教師あり学習のタスクに対して,既存の成果を大きく上回る成果を上げている.本稿では,教師あり学習の精度を大きく高めたBERTを教師無しデータに適用することで,既存手法の性能向上につながる可能性があるという仮説を主張する.本稿では,特許文書を対象に,教師あり学習を行わずに特許の類似性を図る実験を行った.実験の結果,人手で付与した特許分類フラグに対し61.9%の正解率となり,BERTを活用することで教師データを与えずとも,特許の類似度を表現できることを示した.

(5) フレーム知識の自動獲得に向けた文脈化単語埋め込みの有用性の検証

〇 山田 康輔 (名古屋大学), 笹野 遼平 (名古屋大学/理化学研究所), 武田 浩一 (名古屋大学)

本研究では,大規模コーパスからのフレーム知識獲得において,コーパスから収集された動詞の文脈を考慮することの有用性を検証する.具体的には,FrameNetおよびPropBankにおいて2種類以上のフレームを喚起する動詞に着目し,それらの動詞が喚起するフレームの違いをELMoやBERTに代表される文脈化単語埋め込みがどのくらい捉えているかを,各用例の文脈化単語埋め込みのクラスタリング結果とそれらに付与されたフレームを比較することにより調査する.

(6) 機械翻訳を用いた自然言語推論データセットの多言語化

〇 吉越 卓見, 黒橋 禎夫, 河原 大輔 (京都大学)

言語を理解するには、字義通りの意味を捉えるだけでなく、それが含意する意味を推論することが不可欠である。このような推論能力を計算機に与えるために、自然言語推論(NLI)の研究が盛んに行われている。NLIは、前提が与えられたときに、仮説が成立する(含意)、成立しない(矛盾)、判別できない(中立)かどうかを判断するタスクある。自然言語推論を計算機で解くには数十万規模のデータセットが必要となるが、これまでに構築された自然言語推論データセットは言語間でその規模に大きな隔たりがある。この状況は、自然言語推論の研究の進展を妨げる要因となっている。このような背景から、本研究では、機械翻訳にもとづく、安価かつ高速な自然言語推論データセットの構築手法を提案する。提案する構築手法は二つのステップからなる。まず、既存の大規模な自然言語推論データセットを機械翻訳によって目的の言語に変換する。次に、翻訳によって生じるノイズを軽減するため、フィルタリングを行う。フィルタリングの方法として、評価データと学習データに対し、それぞれ別のアプローチをとる。評価データは、正確さが重要となるため、クラウドソーシングを用い、人手で検証する。学習データは、大規模な自然言語推論データセットでは数十万の規模の問題が存在するため、翻訳文の検証を自動的に行い、効率的にデータをフィルタリングする。本研究では、機械翻訳を用いた逆翻訳による手法と、言語モデルによる手法の二つを提案する。本研究では、SNLIを翻訳対象とし、日本語を対象言語として実験を行った。その結果、評価データが3,917ペア、学習データが53万ペアで、自然言語推論モデルの精度が93.0%の自然言語推論データセットを構築した。
===========

●研究会幹事団
主査:
 関根 聡     理化学研究所
幹事:
 内海 慶     株式会社デンソーアイティーラボラトリ
 木村 泰知    小樽商科大学
 古宮 嘉那子   茨城大学
 笹野 遼平    名古屋大学
 進藤 裕之    奈良先端科学技術大学院大学
 横野 光     株式会社富士通研究所
運営委員:
 石垣 達也    産業技術総合研究所
 内田 ゆず    北海学園大学
 江原 遥     静岡理工科大学
 大内 啓樹    理化学研究所/東北大学
 亀甲 博貴    京都大学
 小林 暁雄    農業・食品産業技術総合研究機構
 斉藤 いつみ   日本電信電話株式会社
 佐々木 稔    茨城大学
 須藤 克仁    奈良先端科学技術大学院大学
 田村 晃裕    同志社大学
 成松 宏美    日本電信電話株式会社
 西田 京介    日本電信電話株式会社
 羽鳥 潤     株式会社 Preferred Networks
 増村 亮     日本電信電話株式会社
 松林 優一郎   東北大学
 馬緤 美穂    ヤフー株式会社
 水本 智也    フューチャー株式会社
 三輪 誠     豊田工業大学
 森田 一     株式会社富士通研究所
 谷中 瞳     理化学研究所
 吉川 克正    株式会社コトバデザイン
 鷲尾 光樹    東京大学
———————–