◇ 第146回 自然言語処理研究会

◎ 日 時 平成13年11月20日(火) 13:00~17:15
21日(水) 10:00~15:00

◎ 会 場 立命館大学 びわこ・くわつキャンパス
ローム記念館5F第2会議室
(滋賀県草津市野路東1-1-1)

〔交通手段〕JR琵琶湖線(東海道線)普通で南草津駅下車(京都から約20分)
1番または5番乗り場から近江鉄道バス立命館大学行き(約10分)
詳細はこちらをご覧ください。

〔連絡先〕福本 淳一(立命館大学)
Tel: (077)561-2686, Fax: (077)561-2669


【プログラム】(発表件数16件)

  • 11月20日(火) ― 13:00 ~ 17:15 ―
    • [13:00 ~ 15:00] 形態素          〔4件〕
    • [15:15 ~ 17:15] 情報抽出         〔4件〕
  • 11月21日(水) ― 10:00 ~ 15:00 ―
    • [10:00 ~ 12:00] 意味解析         〔4件〕
    • [13:00 ~ 15:00] 文書分類         〔4件〕

11月20日(火) ― 13:00 ~ 17:15 ―

[13:00 ~ 15:00] ● 形態素          〔4件〕

1. 修正学習法による形態素解析
○中川 哲治、工藤 拓、松本 裕治(奈良先端大)

確率的手法に機械学習の段階適用を組み合わせた修正学習法を提案し,
形態素解析へ応用する。

2. PPM法を用いたかな漢字変換の学習モデル
○丸山 卓久、田中(石井)久美子、武市 正人(東京大学)

かな漢字変換では、ユーザーが過去に入力した文章の情報を蓄えることにより、
学習を行っている。本研究では、ユーザーが入力した文章の単語n-gram情報に
着目し、PPM法を用いた学習モデルを提案する。本稿では、さらに有効性の検証
結果も示す。

3. 帰納的学習を用いた単語分割手法の日本語・中国語・韓国語に対する有効性
○王 忠建、荒木 健治、栃内 香次(北海道大学)

帰納的学習を用いて字面情報から文字列の共通部分,差異部分を
再帰的に抽出することによる単語分割手法の日本語、中国語、韓
国語に対する有効性の評価実験を行い,その結果を報告する。

4. 決定リストにおける規則の適用順序に関する考察
○八木 豊、橋本 泰一、美野 秀弥、徳永 健伸、田中 穂積(東京工業大学)

決定リストの規則に関して,従来の尤度だけでなく規則の
種類の定性的な評価に基づいて適用順序を決定する手法を
提案した.

[15:15 ~ 17:15] ● 情報抽出         〔4件〕

5. キーワード抽出を実現する文書頻度分析
○武田 善行、梅村 恭司(豊橋技術科学大学 情報工学系)

日本語や中国語において,コーパス以外の言語知識を必要とせずに
キーワードを抽出するシステムを構築した.

6. Support Vector Machine の多値分類問題への適用法について
○山田 寛康、松本 裕治(奈良先端科学技術大学院大学)

日本語固有表現抽出を題材に、Support Vector Machine の多値分類問題に
ついて新たに提案する手法と従来の手法との比較を行なう。

7. 漢字インデックスを利用したパラフレーズの抽出
○木村 健司、徳永 健伸、田中 穂積(東工大)

漢字が表意文字であることを利用して,日本語名詞句のパラフレーズを抽出する
手法を提案する.

8. 帰納的学習を用いた機械翻訳手法における数字表現の利用方法について
○松原 雅文、荒木 健治、栃内 香次(北海道大学)

原言語テキストを抽象度の高い数字表現に変換してから翻訳を行う手法を提案し,
その数字表現の利用方法について報告する.

11月21日(水) ― 10:00 ~ 15:00 ―

[10:00 ~ 12:00] ● 意味解析         〔4件〕

9. 日英時間表現の意味と対応関係の解析
○的場 和幸、池原 悟、村上 仁一(鳥取大)

日英両言語の時間表現を解析し,共通の意味表現に置き換えることにより,
日本語から英語への適切な時間表現の生成を試みる.

10. 日本語で表現された対象物の位置的関係の解析
○廣瀬 文男、池原 悟、村上 仁一(鳥取大)

日本語と英語では,対象物の空間的,位置的関係の認識の仕方にかなりの
違いがあり,それが,機械翻訳の品質を低下させる要因の一つとなっている。
そこで,本研究では,この問題に迫るため,話者と対象間,もしくは,
2対象間の方向的位置関係を図式化する方法として,対象物の属性を「形状」,
「スケール」,「その他」の3種類の観点からモデル化した。ただし,
「その他」は,方向概念,上部物体保持能力,下部空間の有無などである。

11. 素性に基づく文法のための辞書記述ツール
○宮田 高志(科学技術振興事業団CREST)、大谷 朗(奈良先端大/大阪学院大)

素性に基づく文法の開発環境の一機能として、辞書記述を支援するための
システムを試作した。本システムの特徴は、実際の解析で使う複雑な素性
構造をそのままユーザにみせるのではなく、データベースのビュー機能を
使って文法との整合性を保ちつつ柔軟に構造を変更できる点にある。

12. 帰納的学習を用いた言語に依存しない意味解析手法の評価
○峨家 正樹、荒木 健治、栃内 香次(北海道大学)

帰納的学習を用いた意味解析システムに対して英語と日本語の
二言語で評価を行い、言語非依存性を確認した

[13:00 ~ 15:00] ● 文書分類         〔4件〕

13. AdaBoostと能動学習を用いたテキスト分類
○塚本 浩司、颯々野 学(富士通研究所)

学習ベースのテキスト分類において、精度よく分類を行なうために必要な
学習文書を、機械学習手法 AdaBoost を用いることで効率的にサンプリン
グする方法を提案する。

14. 異なる発信元からのWWWニュース記事の内容に基づく対応付け
○谷村 正剛、田中(石井)久美子、中川 裕志(東京大学)

現在多くの新聞社等がWWWニュースサイトにて記事を配信している。配信される
記事には同一内容のものがあるため、単純に記事を読むと同一内容の記事を複数
回無駄に読んでしまう問題がある。これを解決するため、本研究では2つの異なる
発信元からの同一内容記事を対応づける。具体的には、記事を発信元により分割し、
2部グラフを構成する。その上で、2部グラフのマッチング問題を解くことにより
対応付けを得る。本稿では、読売新聞と朝日新聞の記事、およびZDNet Japanと
CNet Japanの記事を用いた対応付け結果を報告する。

15. 教師なし文書集合分類における単語選択
○川前 徳章、青木 輝勝、安田 浩(東京大学先端科学技術研究センター)

教師なし文書を内容の類似性によって分類するために文書から利用する
情報とその分類モデルとしての統計モデルの比較・検討を行う

16. 印象に基づく楽曲検索:検索表現の収集と分析
○熊本 忠彦、太田 公子(独立行政法人通信総合研究所)

楽曲印象に基づくクラシック検索において、
人がどのような表現を用いるのかをアンケート調査により調べた。

プログラムの先頭へ戻る。


照会先:松本 裕治 (奈良先端大)
宮田 高志 (サイバーアシスト研究センター)
作成日:平成13年9月19日