情報処理学会 第212回自然言語処理研究会 研究発表会

◎ 日程: 2013年7月18日(木), 19日(金)

◎ 会場: はこだて未来大学 本部棟5F 585教室
アクセス案内: http://www.fun.ac.jp/univoutline/facility.html

◎ 研究会ホームページ:

http://www.nl-ipsj.or.jp/

◎ 照会先:

* 研究会に関する問い合わせ先:
船越 孝太郎 ((株)ホンダ・リサーチ・インスティチュート・ジャパン)
E-mail: funakoshi (at) jp.honda-ri.com

* 会場に関する問い合わせ先:
大塚 裕子(はこだて未来大学)
E-mail: otsuka (at) fun.ac.jp

======================================================================
プログラム (発表件数 11件)

7月18日(木) 13:30~17:30
[13:30~16:00] 自然言語処理一般       [5件]
[16:15~17:30] 招待講演(藤田篤氏)

7月19日(金) 09:30~12:35
[09:30~12:35] 機械翻訳           [6件]
======================================================================

7月18日(木) 13:30~17:30

● 13:30 – 16:00 自然言語処理一般

座長: ニュービッグ グラム(NAIST)

(1) 語彙と文脈情報を用いた反義関係の詳細クラス分類
 ○泉朋子(NTT MI研),柴田知秀(京都大学),齋藤邦子(NTT MI研),松尾義博(NTT MI研),黒橋禎夫(京都大学)

 本稿では,語彙と文脈情報を用いて反義関係にある単語を詳細クラスに分類す
 る手法を提案する.反対の意味を表す反義関係は言語学的に複雑であり,反対
 の観点によりいくつかの詳細クラスに分類される.本稿では,言い換え獲得や
 含意認識など言語処理アプリケーションを指向し,反義関係を「属性の違いを
 表す反義(美しい vs. 醜い)」,「時間的経過を表す反義(入学 vs. 卒業)」,
 「同じ出来事の視点の違いを表す反義(売る vs. 買う)」という3種類の分類方
 法を提案し,さらに計算機による自動分類を行う.実験の結果,複合語の作り
 やすさ,接頭辞,反義単語の共起情報を用いた提案手法によって,85.7%の精度
 で正しく反義の詳細クラスに自動で分類することが可能になった.

(2) 用語管理システムの開発
 ○小山照夫(NII),竹内孔一(岡山大学)

 多くの学会等において用語管理の必要性が指摘されてきているが、現在までの
 ところ、十分な管理が行われているとは言い難い。本研究では、ネットワーク
 を経由して、分野ごとの用語集をそれぞれ複数の人間が保守することのできる、
 用語管理システムの開発を行っている。このシステムでは、用語やシソーラス
 を管理する基本データベースを中心に、テキストからの用語候補抽出システム
 を用いた用語登録支援機能を統合している。

(3) Combined Use of Topic Models on Unsupervised Domain Adaptation for Word Sense Disambiguation
 ○國井慎也,新納浩幸(茨城大学)

 Topic models can be used in the unsupervised domain adaptation for
 Word Sense Disambiguation (WSD). In the domain adaptation task, three
 types of topic model are available. That is, (1) topic model
 constructed from the source domain corpus, (2) topic model constructed
 from the target domain corpus, and (3) topic model constructed from
 the both domains. In this paper, we propose an effective combination
 of topic models and improve accuracy for WSD. Basically, three topic
 features made from each topic model are added to the normal feature
 used for WSD. By using the extended features, SVM is learned and it
 solves WSD. However, the topic feature constructed from source domain
 is put on weight as to similarity between source corpus and the whole
 of corpus. In six ways of domain adaptation using three domains, we
 conduct experiments with varying the combination of topic features and
 show the effectiveness of the proposed method.
 

(4) Domain Adaptation for Word Sense Disambiguation under the Problem of Covariate Shift
 ○菊池裕紀,新納浩幸(茨城大学)

 Word sense disambiguation (WSD) is the task of identifying the meaning
 of an ambiguous word in the sentence. It can be solved by using a
 supervised learning. The problem of domain adaptation of WSD is
 considered that the distribution of source domain P_s(c|x) and target
 domain P_t(c|x) are different. However given the nature of WSD, P_s(c|x)
  = P_t(c|x) is formed and the problem caused by the difference of the
 distribution between source domain’s sense ration P_s(x) and target
 domain’s one P_t(x). That problem of domain adaptation of WSD can be
 regarded as a problem of covariate shift. In this paper, we solve the
 problem by parameter learning method to weight the probability density
 ratio, which is the solution of covariate shift. In comparison with
 techniques daume which is a standardized approach for adaptive region,
 the effect of solving a problem in covariate shift was shown.
 

(5) センター試験『国語』現代文の傍線部問題を解くベースライン法
 ○佐藤理史,加納隼人,西村翔平,駒谷和範(名古屋大学)

 大学入試センター試験『国語』の現代文で出題される、いわゆる「傍線部問題」
 を解く方法を定式化し、実装した。実装した方法により、「評論」の「傍線部
 問題」の半数を正しく解くことができた。
 

● 16:15 – 17:30 招待講演

(6) 言い換え技術の研究動向: 分類体系,知識獲得,応用
 ○藤田 篤(はこだて未来大学)

7月19日(金) 09:30~12:35

● 9:30 – 12:35 機械翻訳

座長:中澤 敏明(JST)

(7) 文レベルの機械翻訳評価尺度に関する調査
 ○ニュービッグ グラム(奈良先端科学技術大学院大学)

 機械翻訳の自動評価尺度は、多くの場合、システム間の優劣判定をどれぐら
 い正確に行えるかというコンテキストで議論される。しかし、システム間の
 比較以外にも、文レベルで訳の質を判定するシナリオも考えられる。文レベ
 ルで訳の質を高精度で判定できるのであれば、システムが苦手としている文
 を効率的に収集し、分析することでシステムの改良点を特定することが可能
 となる。本稿では、現在システムの比較で広く使われているBLEU、RIBES、TER、
 METEORなどの評価尺度が文レベルでどの程度機能するかについて調査する。
 

(8) 構文情報が機械翻訳に及ぼす影響の分析
 ○丹生伊左夫,ニュービッグ グラム,小林和也,サクティ サクリアニ,戸田智基,中村哲(奈良先端大)

 統計的機械翻訳では広く使われるフレーズベース翻訳 (PBMT) 以外にも階層
 的フレーズベース翻訳 (Hiero),構文情報を用いた翻訳 (Tree-to-string,
 Forest-to-string) などの方式が提案されている.そこで,本稿では京都フ
 リー翻訳タスク (KFTT) に対して,PBMT,Hiero,Tree-to-stringさらに
 Forest-to-stringの4手法を,BLEUとRIBESという2つの自動翻訳評価尺度で
 比較したので報告する.さらに,機械翻訳を実行する前に,入力文の語順を
 事前に並べ替える手法の効果についても調査した.

 
(9) 同時通訳データを利用した同時通訳用機械翻訳システムの構築
 ○清水宏晃,ニュービッグ グラム,サクティ サクリアニ,戸田智基,中村哲(奈良先端大)

 従来,機械翻訳システムに利用される対訳コーパスは主に翻訳データが用い
 られている.しかし,講演を自動的に同時通訳するシステムを構築する場合,
 通訳者は同時性を高めるために訳文において様々な工夫を行っており,翻訳
 データで学習された機械翻訳システムではこの工夫を捉えきれない.そこで,
 本研究では同時通訳用機械翻訳システムの構築を目指し,通訳者が実際に同
 時通訳を行った音声を書き起こした同時通訳データを対訳コーパスとして利
 用することで,通訳者のような訳文を生成する機械翻訳システムが構築可能
 かどうかを調査する.

【5分休憩】

(10) 隠れマルコフ木モデルを用いた単語アラインメント
 ○近藤修平,Duh Kevin,松本裕治(奈良先端大)

 語順の大きく異なる言語間での単語アラインメントを改善するために、両言
 語側の依存構造木を用いた、隠れマルコフ木モデルに基づく単語アラインメ
 ント手法を提案する。
 

(11) 統計的機械翻訳におけるWordNetを用いたフレーズ意味曖昧性解消手法の提案
 ○大山鉄郎,関洋平(筑波大学)

 文脈の特徴から単語の意味を推定する語義曖昧性解消)は,機械翻訳の分野
 において,多義語の翻訳に有用な要素技術として認識されている.しかし,
 フレーズベース統計的機械翻訳では,フレーズ単位による翻訳を行うため,
 単語を単位としたWSDの効果が必ずしも期待できない.本研究では,翻訳単位
 であるフレーズの意味の曖昧性解消手法を提案する.提案手法は,概念辞書
 WordNetを用いて,入力文の周辺語と対象フレーズを含む対訳文の周辺語との
 意味的な類似度からフレーズの意味を推定する.提案手法を組み込んだ機械
 翻訳システムは,組み込まない場合と比較して,自動評価尺度BLEUにおいて
 有効性を示した.
 

(12) パテントファミリーを用いた専門用語訳語獲得における対訳文対非抽出部分およびフレーズテーブルの利用
 ○豊田樹生,龍梓,董麗娟,宇津呂武仁,山本幹雄(筑波大学)

 パテントファミリーとなる日英対訳特許文書中の背景および実施例部分のう
 ち, 対訳文対抽出の対象となっている部分(30%)から学習したフレーズテー
 ブル、および、 対訳文対抽出の対象外となっている部分(約70%)を言語資源
 として,専門用語の 訳語推定を行った結果について報告する.
 

======================================================================

★ 研究報告のペーパーレス化

本研究会はペーパーレスでの開催となり,印刷した研究報告の配布を行いませ
ん.また,特許出願の公知日(研究報告の公開日)が従来より1週間早まります
ので,ご留意ください.

[自然言語処理研究会に登録されている方]
研究報告は研究発表会の一週間前に電子図書館と当日閲覧用サイトで公開しま
す.当日は資料をプリントアウトしてご持参いただくか,ご自身のPCにダウン
ロードの上PCをご持参ください.

■情報処理学会電子図書館(情報学広場)
※ご利用にはユーザ登録が必要です.
https://ipsj.ixsq.nii.ac.jp/ej/

■当日閲覧用サイト
http://www.ipsj.or.jp/sig-reports/

[自然言語処理研究会に登録されていない方]
当日受付で当研究発表会の資料閲覧用にUSBメモリを貸し出します.当日はノー
トPC等をご持参ください.尚,当研究会にご登録いただくことで当研究会の資
料のバックナンバーも含めてすべて電子図書館でご購読いただけます.登録さ
れていない方は,是非この機会に研究会に登録してください.
(登録まで最大3日かかりますのでご留意ください)

★ 受け付けは先着順で行なっております.
締切間際になりますと,申し込み件数によりましては次回の研究会にまわって
頂くようお願いする場合がございます.申し込みを予定しておられます方はな
るべく早めにお申し込み下さい.

★ 締め切り後の発表キャンセルは原則としてできません.
発表申し込み後にキャンセルの必要が生じた場合にはなるべく早くご連絡くだ
さい.発表申込後,学会が提示する原稿提出締め切りまでに原稿が到着しない
場合には,幹事団の判断により発表を取り消しさせていただくこともあります.

★ 論文提出締切後の原稿差し替えはできません.
論文提出締切後は,訂正版のアップロードやウェブ上での配布などの原稿差し
替えは一切できませんので,予めご留意ください.
※ただし正誤表の掲載が可能な場合がありますのでご相談ください.