◎ 日程: 2012年11月22日(木), 23日(金)
◎ 会場: 京都大学 学術情報メディアセンター 南館 2階 201講義室 (京都市左京区二本松町)
交通アクセス情報: http://www.media.kyoto-u.ac.jp/ja/access/index.html#s_bldg
研究会の開催期間は、観光のため京都市内の混雑が予想されます。観光地を通
るバスでの長距離移動を避けられることを強くお勧めします。京都駅から会場
までは、JR東福寺駅を経由し京阪神宮丸太町駅で下車されるか、地下鉄で今出
川駅まで行きバスに乗り京大正門前で下車するとよいでしょう。
23日は祝日のため、建物入り口が施錠されております。係員を配置しますが、
できる限り、招待講演開始までに入場して下さいますようお願いします。
◎ 京都大学 学術情報メディアセンター 共催
◎ ホームページ http://www.nl-ipsj.or.jp/
◎ 照会先:
* 研究会に関する問い合わせ先:
森 信介 (京都大学)
E-mail: forest (at) i.kyoto-u.ac.jp
* 会場に関する問い合わせ先:
同上
======================================================================
プログラム (発表件数 16件(招待講演を含む))
11月22日(木) 10:00 – 17:30 ※1件キャンセルの為、午後の時間が変更になりました。ご注意ください!
[10:00 – 12:00] 応用・対話 [4件]
[13:30 – 15:00] 解析・誤り訂正 [3件]
[15:30 – 17:30] 言い換え・要約・学習 [4件]
11月23日(金) 09:30 – 14:30
[09:30 – 11:00] 招待講演 [1件]
[12:30 – 14:30] 機械翻訳・生成 [4件]
======================================================================
11月22日(木) 10:00 – 17:30
※1件キャンセルの為、午後の時間が変更になりました。ご注意ください!
■ 10:00 – 12:00 応用・対話 [4件]
座長: 柴田 知秀 (京大)
(1) 社会科学系論文を対象にした要旨作成システム
– 金子 満生, 恵谷 淳一郎, 韓 東力(日本大学)
– 本研究では重要語句抽出と文内・文間の繋がりの強化に基づき、社会科学
系論文の要旨作成を試みた
(2) 論文間参照情報のデータベース化に基づく参照タイプの同定
– 小出 寛史, 高橋 真也, 松本 惇, 横堀 圭太, 韓 東力(日本大学)
– 学術論文間の参照情報をデータベースに格納し、さらに機械学習により論
文間参照タイプの同定を試みた。
(3) 長い系列データに対する Markov Logic Network の適用
– 森田 一, 奥村 学(東京工業大学), 東中 竜一郎, 松尾 義博(NTT)
– Twitter上のツイートの系列を対象とした発話間の関係推定をMarkov
Logic Networkを用いて行う
(4) 隣接するツイート間の関係を考慮したマイクロブログのトピック推定
– 中村 直哉, 笹野 遼平, 高村 大也, 奥村 学(東京工業大学)
– マイクロブログにおいて、同一ユーザの隣接するツイートで同じトピック
が続きやすい点に注目した新しいトピックモデルを提案する。
■ 13:30 – 15:00 解析・誤り訂正 [3件]
座長: 高橋 哲朗 (富士通研究所)
(*) 当初、発表番号5番がキャンセルとなりましたので、6番以降が5番からに変更となります。
(5) 大規模英語学習者コーパスを用いた英作文の文法誤り訂正の課題分析
– 水本 智也, 林部 祐太, 小町 守(奈良先端大), 永田 昌明(NTT),
松本 裕治(奈良先端大)
– 大規模な学習者コーパスを用いて,統計的機械翻訳の手法により全ての誤
りを対象に誤り訂正を行い,コーパスサイズを変化させることで,誤りの
タイプごとに訂正性能がどのように変わるかを調べ,分析を行なった。
(6) 点予測による述語項構造解析
– 吉野 幸一郎, 森 信介, 河原 達也(京都大学)
– 点予測に基づく意味ラベル付与を用いた述語項構造解析を行う。点予測に
より部分的アノテーションを利用し、より効果的な言語資源の活用が可能
である。
(7) 英語の複単語表現辞書の構築と品詞タグ付けへの応用
– 重藤 優太郎, 東 藍, 近藤 修平, 北裏 龍太, 坂口 慶祐, 光瀬 智哉,
久本 空海, 吉本 暁文, Frances Yung, 松本 裕治(奈良先端大)
– Wiktionaryを元に英語の複単語表現辞書を構築し、それを用いて品詞タ
ガーの学習と評価を行った。
■ 15:30 – 17:30 言い換え・要約・学習 [4件]
座長: 木村 俊也 (ミクシィ)
(8) リムる・ドヤる・ポジる・パフェる ーWebを用いたカタカナ動詞の言い換え・語源の獲得ー
– 鈴木 雄登, 笹野 遼平, 高村 大也, 奥村 学(東京工業大学)
– Webを用いて,リムるのようなカタカナ動詞の言い換えと語源を獲得する
(9) やさしい日本語ニュースの公開実験サイト「NEWS WEB EASY」の評価実験
– 田中 英輝, 美野 秀弥, 越智 慎司, 柴田 元也(NHK)
– 外国人と子ども各60名を対象に,やさしい日本語のニュースの理解度を測
定した.この結果,どちらの被験者でも,やさしい日本語のニュースの理
解度が通常ニュースを上回ることが確認できた.
(10) ユニット制約の緩和による柔軟な日本語文圧縮
– 原島 純, 黒橋 禎夫(京都大学)
– 文節を基本的な抽出単位としつつ、文節内の不要な単語を除去することも
できる文圧縮手法を提案する。
(11) k近傍法でハブを軽減する類似度尺度
– 鈴木 郁美, 原 一夫(国立遺伝学研究所), 新保 仁(奈良先端大)
– k近傍法は自然言語処理や機械学習で広く使われている.しかし,データが
高次元になるとハブの影響を受けやすい.本論文では,類似度尺度を工夫
することにより,ハブを軽減することを試みる.
11月23日(金) 09:30 – 14:30
■ 09:30 – 11:00 招待講演
座長: 徳永 健伸 (東工大)
(12) 電子図書館と自然言語処理
– 長尾 真 (京都大学名誉教授)
– 電子図書館は書物を単に電子化して記憶し、取り出すといったものではな
い。電子書籍はマルチメディア著作物になるし、書物を構造化し、どの部
分でも取り出せるようにできるので、他の書物の関係する部分も連想的に
取り出すことができる。検索の方法も種々の方法がありうる。こうして電
子書籍を知識のネットワークに作り上げることによって、情報検索から事
実検索にすすんでゆける。究極は人間頭脳内の知識構造に近いものを作る
ことを目指す。
こういったことを実現するためには多くの強力な自然言語処理技術の研究
開発が必要となる。
■ 12:30 – 14:30 機械翻訳・生成 [4件]
座長: 中澤 敏明 (京大)
(13) 同時性を考慮した音声翻訳システムの検討
– 藤田 朋希, Graham Neubig, Sakriani Sakti, 戸田 智基, 中村 哲(奈良先端大)
– 同時性の高い音声翻訳システムを実現するために,文より短い単位で翻訳
を行う手法を提案し,その翻訳精度を調べた.
(14) Patterns for simplifying complex sentences in English-Japanese machine translation
– To Thi Chinh, Kevin Duh, Mamoru Komachi, Kondo Shuhei, Yuji Matsumoto(NAIST)
– We analyze and summarize the patterns of complex sentences, and
use the patterns to divide the sentences into simple parts for
machine translation.
(15) A Flexible Framework for Extracting Bilingual Dictionary from Comparable Corpus Without any Language-Special Knowledge
– Xiaodong Liu, Kevin Duh, Yuji Matsumoto(NAIST)
– We propose a flexible and effective framework for extracting
bilingual dictionaries from comparable corpora without using any
other language-special knowledge such as seeds or additional
dictionaries. Our approach is based on a novel combination of
topic modeling and word alignment techniques in a pipeline style:
first, our approach converts a comparable document-aligned corpus
into a parallel topic-aligned corpus using topic modeling
techniques, then learns translation relationships between words
using word alignment models such as IBM mode I.
(16) 参照表現生成のための適切な投射型空間語の選択
– 綿谷 俊昭, 飯田 龍, 徳永 健伸, 寺井 あすか(東京工業大学)
– 斜め方向を表わす投射型空間語「右上」に注目し,その適切な選択基準を
求めるために実施した被験者実験の分析結果を示す.
======================================================================
★ 研究報告のペーパーレス化
本研究会はペーパーレスでの開催となり,印刷した研究報告の配布を行いませ
ん.また,特許出願の公知日(研究報告の公開日)が従来より1週間早まります
ので,ご留意ください.
[自然言語処理研究会に登録されている方]
研究報告は研究発表会の一週間前に電子図書館と当日閲覧用サイトで公開しま
す.当日は資料をプリントアウトしてご持参いただくか,ご自身のPCにダウン
ロードの上PCをご持参ください.
■本会電子図書館
※ご利用にはBookPark上でユーザ登録(無料)が必要です.
http://www.bookpark.ne.jp/ipsj/
研究会 自然言語処理(NL)をチェックしてください.
登録まで最大3日かかりますのでご留意ください.
■NII電子図書館
※ご利用にはユーザ登録が必要です.
http://ipsj.ixsq.nii.ac.jp/ej/
■当日閲覧用サイト
http://www.ipsj.or.jp/sig-reports/
[自然言語処理研究会に登録されていない方]
当日受付で当研究発表会の資料閲覧用にUSBメモリを貸し出します.当日はノー
トPC等をご持参ください.尚,当研究会にご登録いただくことで当研究会の資
料のバックナンバーも含めてすべて電子図書館でご購読いただけます.登録さ
れていない方は,是非この機会に自然言語処理研究会に登録してください.
(登録まで最大3日かかりますのでご留意ください)