第235回自然言語処理研究会・第121回音声言語情報処理研究会 参加募集

開催概要

●日程:2018年5月13日(日)(開催は1日のみになりました)
●会場:東京大学本郷キャンパス工学部2号館3階電気系会議室1
キャンパスマップ:
http://www.u-tokyo.ac.jp/campusmap/map01_01_j.html
アクセスマップ:
http://www.u-tokyo.ac.jp/campusmap/map01_02_j.html

============================

●研究会に関する問い合わせ先:
NL研究会: 中澤敏明(東京大学),荒瀬由紀(大阪大学)
E-mail: nakazawa (at) logos.t.u-tokyo.ac.jp
E-mail: arase (at) ist.osaka-u.ac.jp
SLP研究会: 西村雅史(静岡大学)
E-mail: nisimura (at) inf.shizuoka.ac.jp
会場係: 峯松信明(東京大学)
E-mail: mine (at) gavo.t.u-tokyo.ac.jp

============================

プログラム(発表件数7件)

5月13日(日)10:00-16:30
[10:00-11:00] 生成・合成 [2件]
[11:00-12:00] 招待講演 [1件]
[12:00-13:30] 昼食休憩
[13:30-14:30] 学生セッション (1) [2件]
[14:30-14:45] 休憩
[14:45-15:45] 学生セッション (2)・知識獲得 [2件]
[15:45-16:00] クロージング

5月13日(日)10:00-16:30

[10:00-11:00] 生成・合成 [2件]

座長:貞光 九月(フューチャー株式会社)

(1) [NL] 深層学習を用いた俳句の自動生成

太田 瑶子 (NAIST)

文学の一つとして詩がある.詩は言葉の表面的な意味だけでなく,言葉が持つ
美学的・喚起的な性質を用いて表現される.詩は短い文字列であっても,詩と
して表現する事で,言葉の持つ奥深さによってその場の雰囲気を封じ込めるこ
とが出来る.しかし,実際にいざ詩を作ろうとすると,どのように始めれば良
いのか難しい.そのような場合であっても,手軽に詩を作れるようにしたいと
考えた.本研究では,詩の中でも有季定型俳句を選び,言葉を入力することに
より俳句の自動生成を行った.本研究ではより柔軟な表現が生成できるように,
深層学習を使った.また,韻律や季語のような有季定型俳句の規定を素性や制
限として用いた.俳句としての体をなすような生成結果が得られた.

(2) [SLP] 日本語韻律構造を考慮したprosody-aware subword embeddingとDNN多方言音声合成への適用

高道 慎之介, 秋山 貴則, 猿渡 洋 (東大)

音声合成技術の急速な発展に伴い,日本共通語の音声合成に留まらない次世代
音声合成技術が必要とされている.その1つとして我々は,特定話者の声色で
あらゆる日本語方言の音声を合成できる多方言音声合成の研究を実施しており,
本稿は,そのための韻律コンテキスト生成を扱う.韻律規則が古くから研究さ
れている日本共通語では,規則及び辞書ベースの韻律コンテキスト生成が可能
だが,多様な方言を扱う多方言音声合成では,各方言に対してそのような韻律
規則を決定することは現実的ではない.一方,音声コーパスから韻律コンテキ
ストを教師なし推定する prosody-aware word embedding が提案され,英語音
声合成における有効性が報告されている.しかしながらこの手法は,方言に含
まれる未知語の韻律コンテキストを適切に生成できず,また,利用する韻律情
報に過不足がある.これに対し本稿では,日本語韻律構造を考慮した
prosody-aware subword embedding を提案する.日本語テキストは出現文字頻
度と日本語韻律構造に基づいて subword 系列に分割されるため,未知単語を
既知 subword 系列に効果的に分割できる.本稿では更に,この提案法を多方
言音声合成に適用し,方言混合 subword モデリングと,多方言 subword
embedding を提案する.実験的評価では,日本共通語および20の方言の音声合
成において主観評価を実施し,提案法の有効性を示す.

[11:00-12:00] 招待講演 [1件]

座長:関根 聡(理化学研究所)

(3) Linguistic insights in text normalization

Kyle Gorman (Google)

Many speech and language applications, including speech recognition and synthesis, require mappings between “written” and “spoken” (e.g., pronounceable) forms of entities like cardinal and ordinal numbers, dates and times, and the like (e.g., “$328” vs. “three hundred twenty eight dollars”). Collectively, such conversions are known as text normalization. Despite substantial progress in applied machine learning, it is still the case that real-world text-to-speech (TTS) synthesis systems largely depend on language-specific hand-written rules. These may require a great deal of development effort and linguistic sophistication and as such, represent substantial barriers for quality control and internationalization.

I first consider the case of number names. I propose two types of computational models for learning this mapping. The first uses end-to-end recurrent neural networks. The second, inspired by prior literature on cross-linguistic variation in number systems, uses an induction strategy based on finite-state transducers. While both models achieve near-perfect performance, the latter model can be trained using several orders of magnitude less data, making it particularly useful for low-resource languages. The latter model is currently being used at Google to develop new number name grammars for hundreds of languages.

I then consider homographs, i.e., words whose pronunciation depends on the intended sense (e.g., “read”, which can either rhyme with “feed” or “fed”). I describe an existing rule-based system and compare it to a novel system which performs homograph disambiguation using simple machine learning. An evaluation of these two systems, using a new, freely-available data set, finds that a hybrid system (using both rules and machine learning) is significantly more accurate than either rules or machine learning alone. This new hybrid system is used on all English TTS traffic at Google.

[12:00-13:30] 昼食休憩

[13:30-14:30] 学生セッション (1) [2件]

座長: 木村 俊也(株式会社メルカリ)

(4) [NL] 統計的翻訳とニューラル翻訳に基づく翻訳候補文の分散表現と逆翻訳によるリスコアリングの検討

佐橋 広也, 西村 友樹, 秋葉 友良 (豊橋技科大), 中川 聖一 (中部大/豊橋技科大)

近年、ニューラル機械翻訳(NMT)が目覚ましい発展を遂げており、従来の統計
的翻訳機械翻訳(SMT)の性能を上回っている。 しかしNMTはSMTに比べ、学習に
必要なパラレルコーパスの量が十分でなければ、翻訳性能を向上させることが
難しく、翻訳の語彙サイズについても制限を持つ。 そのため機械翻訳の候補
をリスコアリングし、性能を向上させる研究が複数報告されている。 SMTでは
ラティスデコーディングを使用した翻訳候補のリスコアリングが行われている。
NMTでは翻訳候補を別のNMTで再度スコアを評価しリスコアリングする方法が報
告されている。 SMTとNMTでは同じ文でも翻訳結果が異なることが多く、両手
法を相補的に使用する方法が考えられる。 そこで、SMTとNMT両方を併用した
翻訳システムとして、SMTのシステムやフレーズテーブルを組み込んだNMTの報
告がされている。 本稿では同じパラレルコーパスで学習したNMTとSMTの翻訳
文を比較し、人為的、または文の分散表現ベクトルを利用して自動的にリスコ
アリングする手法を報告する。

(5) [NL] 敵対的生成を利用した校正要否の識別

竹中 誠 (首都大), 柳瀬 利彦, 小泉 敦子 (日立製作所), 江原 遥 (産総研)

文章の校正は一般には人手によるものであり,これを自動化することは人手コ
スト削減に大きな寄与を果たす.本研究ではマニュアル文の自動校正を見据え,
校正要否の識別性能を向上させる手法を提案する.校正要否の識別において解
くべきタスクは,校正対象の文章を入力とした二値分類タスクである.マニュ
アルにおいて校正前の文は一般には公開されていないため,分類器の教師あり
学習で利用するほど大量の校正前の文を入手することは困難である.一方,校
正後の文章は大量に存在する.そこで本研究では,校正後の文から擬似的に校
正が必要な文を生成し,教師データとして利用する方法を提案する.提案手法
では,人手で書かれた文か生成された文かを見分ける分類器を活用する.これ
により,人手で書かれた文と近い校正が必要な文を生成する.実験では,提案
手法で拡張した教師データを利用することで,要否の識別性能が向上すること
を確認した.また,マニュアル文の特性から導かれる擬似データ生成による精
度向上の限界を議論した.

[14:30-14:45] 休憩

[14:45-15:45] 学生セッション (2)・知識獲得 [2件]

座長: 江原 遥 (産総研)

(6) [NL] 雑談対話システムのための興味推定

田中 昂志, 高山 隼矢, 荒瀬 由紀 (阪大)

近年,人間との雑談を目的とした対話システムが広く普及している.雑談対話
システムが多くのユーザに長期的に利用されるためには,出身地や性格等のユー
ザ情報に沿った会話が有効であると期待される.本研究では,そのようなユー
ザ情報の中でもユーザの興味に焦点を当てる. 一方,ユーザが興味を持つ表
現は対話システム側のコーパス内に入っていない新単語であることが多い.対
話システム内の興味推定部が新単語に対しても推定できることは,任意の表現
に対して興味の有無を推定するために必要不可欠である.しかし,興味推定を
タスクとしている研究は数多くあるが,未知語を考慮している研究は少ない.
そこで,本研究では対話文における未知語を含んだ興味対象の推定を目的とす
る.

(7) [NL] Block HolE: 関係行列の同時対角化に基づく知識グラフ埋め込みモデルの問題点とその解決

林 克彦 (阪大), 真鍋 陽俊, 石原 敬大, 新保 仁 (NAIST)

近年、知識グラフ埋め込みに関する研究が盛んに行われている。知識グラフ埋
め込みは、未知の事実に対しても、その真偽値をスコア化することができるた
め、知識グラフ補完や質問応答などのタスクに応用されている。埋め込みモデ
ルは、双線形、平行移動、ニューラルネットに基づく変換を用いた3種類のモ
デルに大別されるが、近年、平行移動、及び、ニューラルネットに基づくモデ
ルはいくつかの問題点が指摘されており、現在では双線形モデルが主流となっ
ている。しかし、DistMult、HolE、ComplEx等の双線形モデルは関係を表す行
列を同時対角化して導出するため、関係行列同士が可換となる。本稿では関係
行列における可換性の仮定がもたらす実用上の致命的な問題を指摘し、それを
解決する新しい知識グラフ埋め込みモデルを提案する。

[15:45-16:00] クロージング

============================

※自然言語処理研究会に登録されている方
研究報告は研究発表会の1週間前に電子図書館と当日閲覧用サイトで公開
します.当日は資料をプリントアウトしてご持参いただくか,ご自身の
PCにダウンロードのうえ,ご持参ください.

情報処理学会電子図書館(情報学広場)
https://ipsj.ixsq.nii.ac.jp/ej/ (ユーザ登録が必要です)
当日閲覧用サイト
http://www.ipsj.or.jp/sig-reports/

※自然言語処理研究会に登録されていない方
当日受付で本研究発表会の資料閲覧用にUSBメモリを貸し出します.
当日はノートPC等をご持参ください.なお,当研究会にご登録頂くことで,
本研究会の資料をバックナンバーも含めて電子図書館で購読できます.
登録されていない方は,是非この機会に研究会に登録してください
(登録まで最大3日かかりますのでご留意ください).

★研究会への登録をお勧めします
年に2回以上の参加を見込まれる方は,研究会に登録される方が(ほぼ)
お得になります.研究会登録は以下のウェブサイトから行えます.
http://www.ipsj.or.jp/kenkyukai/toroku.html

============================

★NL研究会幹事団
主査:
関根聡  (理化学研究所)
幹事:
荒瀬由紀 (大阪大学)
木村俊也 (株式会社メルカリ)
進藤裕之 (奈良先端科学技術大学院大学)
中澤敏明 (東京大学)
西川仁  (東京工業大学)
桝井文人 (北見工業大学)
横野光  (株式会社富士通研究所)
運営委員:
浅原正幸 (国立国語研究所)
荒牧英治 (奈良先端科学技術大学院大学)
石野亜耶 (広島経済大学)
内海慶  (株式会社デンソーアイティーラボラトリ)
内田ゆず (北海学園大学)
小林隼人 (Yahoo! JAPAN 研究所)
佐々木稔 (茨城大学)
笹野遼平 (名古屋大学)
貞光九月 (フューチャー株式会社)
佐藤敏紀 (LINE株式会社)
数原良彦 (Recruit Institute of Technology)
高村大也 (産業技術総合研究所/東京工業大学)
土田正明 (株式会社コトバデザイン)
徳永拓之
二宮崇  (愛媛大学)
羽鳥潤  (株式会社 Preferred Networks)
藤田早苗 (日本電信電話株式会社)
牧野拓哉 (株式会社富士通研究所)
松崎拓也 (名古屋大学)
松林優一郎(東北大学)
ミハウ・プタシンスキ(北見工業大学)
村脇有吾 (京都大学)
若木裕美 (ソニー株式会社)

★SLP研究会幹事団
主査:
西村雅史 (静大)
幹事:
山岸順一 (NII)
福田隆  (日本IBM)
塩田さやか(首都大)
俵直弘  (早稲田)