※ 電子情報通信学会 言語理解とコミュニケーション研究会 (NLC)との共催です.
◎日 時 平成18年7月27日(木)13:30~17:20
28日(金)10:00~14:20
◎会 場 はこだて未来大学
〒041-8655 北海道函館市亀田中野町 116番地2
http://www.fun.ac.jp/
[交通手段]
はこだて未来大学へのアクセスを御覧ください.
◎問い合わせ先
- 会場に関する問い合わせ先:
大沢 英一(おおさわ えいいち)(はこだて未来大)
E-mail: osawa(at)fun.ac.jp - 研究会に関する問い合わせ先:
乾 健太郎(いぬい けんたろう)(奈良先端大)
E-mail: inui(at)is.naist.jp
Phone: 0743-72-5241
【プログラム】(発表件数13件)
7月27日(木) ― 13:30 ~ 17:20 ―
[13:30~15:00] ● 形態素・固有表現 〔3件〕
[15:20~17:20] ● テキストの類似性・文処理モデル 〔4件〕
7月28日(金) ― 10:00 ~ 14:20 ―
[10:00~11:30] ● 意味・応用 〔3件〕
[12:50~14:20] ● 談話・要約 〔3件〕
7月27日(木) ― 13:30 ~ 17:20 ―
1. 組織情報を用いた人名の曖昧性解消方式
○相薗敏子(日立)
人名文字列の同姓・同名による曖昧性を解消するため,同一文中に出現する組織名を
利用した方式を提案する.
2. 文化遺産に関する説明文の対象ユーザに合わせたの言い換えの研究
○藤沢仁子・神門典子(総研大)
文化遺産に関する記述からメタデータを自動的に生成する手法を提案する.作品に関
連する人物とその役割の抽出と,異なるユーザグループに合わせた説明文の生成に焦
点を当てる.
3. ウェブ・ページ内での共起を使った同形異音語処理
○隅田英一郎(NiCT)・菅谷史昭(KDDI研)
ウェブから学習データを取得し機械学習プログラムで分類器を生成して同形異音語の
読みの曖昧性を解消する.
[15:20~17:20] ● テキストの類似性・文処理モデル 〔4件〕
4. テキスト分析における2部グラフクラスタリングの可能性
○赤間啓之・三宅真紀・鄭 在玲(東工大)
テキスト解析にマルコフクラスタリング(MCL),およびそれを独自に改良したリカレ
ント・マルコフクラスタリング(RMCL)を利用する場合,まず,単語の共起情報から隣
接行列を生成してグラフ化しなくてはならない.本稿ではそのために有効なデータ取
得法として,キーワードと共起語のペアに基づく,2分グラフ化の方法を提案し,
MCL-RMCLによる2分グラフクラスタリングの計算結果を,従来のベクトル空間モデル
に基づく多変量解析,とくにここでは回転付き因子分析結果と比較,有効性を検証す
る.
5. AdaBoostを利用した字幕テキストからの定型表現文章区間抽出
○山田一郎・三浦菊佳・住吉英樹・八木伸行(NHK技研)・奥村 学・徳永健伸(東工大)
テレビ番組のナレーションでは,「場所紹介」や「人物紹介」など特定の事柄を表現
するために同じような言い回しが多用される.そこで本稿では,番組のクローズドキ
ャプションを対象として定型表現を含む文章区間を抽出する手法を提案する.提案手
法では,複数文のテキストデータから木構造を生成して,木構造間の類似性を評価す
る.この結果を弱学習器としたAdaBoostアルゴリズムにより学習を行い定型表現か否
かの判定を行う.
6. 意味的等価性検証に基づく記述式解答文の採点法
○秋葉泰弘・田中貴秋・須山敬之・永田昌明(NTT CS研)
e-Learningにおける記述解答文の採点自動化に向け,構文意味情報に基づき文同士の
意味的等価性を検証する技術を提案する.
7. 語順効果における、作業記憶に基づく文処理モデル
○高橋 慶・吉本 啓(東北大)
本発表では人間の言語処理の視点から,文の容認性と語順効果との関係を取り上げる.
まず,現段階での統語的分析では容認性の予測不可能な例を挙げ,文法のみによる分
析の問題点を述べる.次に,処理器の特性として認められるような例を取り上げ,統
語との関連のみではなく,処理器との関連であることの可能性を示す.そこで,作業
記憶に基づく文処理モデルを提案し,問題となる文に対し,統一的な説明を試みる.
7月28日(金) ― 10:00 ~ 14:20 ―
8. 品詞の別を問わない語の(共)項構造の多次元的表現法 ~ (Parallel) Pattern
Matching Analysis の簡略版を用いて ~
○黒田 航(NICT)・飯田 龍(奈良先端大)
NomBank (Meyersら2004) に代表される名詞の(共)項構造データベースを日本語につ
いて開発するため,従来の係り受け解析と互換性を保ち,かつその表現力の不足を
補う記述方法を (Parallel) Pattern Matching Analysis (PMA; Kuroda 2000) に基
づいて提案し,その実例を示す.PMA は文 s = m[1] m[2] … m[N] (ただし m[i]
は i 番目の形態素とする)の統語構造を NxN 行列 (これを s の共起条件(表現)行列
と呼ぶ) として与える (i 行目には m[i] が実現する統語パターンが指定される).
共起条件行列は従来の依存構造分析 (e.g., 係り受け解析) の自然な拡張である.
PMA の簡略版は,(i) 解析の対象を名詞,動詞,形容詞のような実詞類に限定し
(ii) 共起行列に現われる指定を Arg0,Arg1 のような項構造を特定する記号に限定し
たものである.
9. 中国語への翻字における漢字選択の手法
○黄 海湘・藤井 敦(筑波大)・石川徹也(東大)
外国語の固有名詞や専門用語を取り入れるときに,日本語や韓国語ではカタカナやハ
ングルなどの表音文字を用いて翻字することが多い.中国語では漢字を用いて翻字す
る.漢字は表意文字であるため,音は同じでも漢字によって与える印象が異なる.本
研究は,中国への翻字において適切な漢字選択するために,発音だけでなく,翻字対
象の印象や種別(人名,企業名など)を考慮する手法を提案する.
10. メーリングリストを利用した質問応答システムのための知識の内容確認
○渡辺靖彦・西村 涼・岡田至弘(龍大)
自然言語で記述されたweb文書を知識として利用する質問応答システムでは,知識と
して利用する文書に含まれる誤りが問題になる.筆者らは,メーリングリストに投稿
されたメールを利用して how 型の質問に答える質問応答システムを試作したが,知
識として利用したメールには誤りを含むものが少なくなかった.そこで,メーリング
リストに投稿されたメールに含まれる誤りを検出する方法について述べる.検出した
誤りの情報は,質問応答システムの知識からとりのぞくのではなく,誤った解決方法
の例をユーザに示すために利用する.
11. 修辞関係による名詞句の指示対象の推論に関する研究
○大竹 塁(東北大)
本研究は日本語の名詞句の指示対象を推論によって特定するモデルの構築を目的とす
る.理論的枠組みとして,複数の文がどのような修辞関係によって結びつけられてい
るかという点に着目した分節談話表示理論 (Asher and Lascarides 2003) を採用す
る.本発表では特に主要部内在型関係節構文を例にとり,不完全な意味情報が推論に
よって補完される際に,主節と関係節それぞれが表す2つの命題を結ぶ修辞関係を用
いることの有効性を論ずる.
12. 文間接続関係の自動同定のための人間による同定分析
○齋藤真実・山本和英(長岡技科大)・関根 聡(ニューヨーク大)
テキスト中に表われる文間の接続関係を大規模テキストによる統計的データから自動
的に推定する手法を提案する.先行研究では文中の単語のペアを用いて接続関係を推
定する手法を用いているが,我々は更に文の構文にも注目して文間の接続関係を推定
している.
13. 濃縮還元型文要約モデルの検討
○池田諭史・牧野 恵・山本和英(長岡技科大)
人間が要約を行う際は原文から必要な表現を抜き出し,その表現を用いて文を作成す
ることがある.そこで,人間と同様に原文から要約に必要な表現を抽出し(濃縮),
その表現に機能語を補完することで文を生成する(還元)要約モデルの検討を行った.
作成日: 平成18年5月24日
変更日: 平成18年7月26日