◇ 第162回 自然言語処理研究会

◎日 時 平成16年7月15日(木) 10:00 ~ 17:30
16日(金)  9:00 ~ 17:30

◎会 場 北海学園大学(山鼻キャンパス) 3号館1階
〒064-0926 札幌市中央区南26条西11丁目1-1

  • [交通手段]
  • バス(定鉄バス)
    訂正) 本年4月より、ご来校される際に利用できるバスの「市営バス」は全て「定鉄バス」に変わりました。ただし、路線自体の変更はございません。
    • JR札幌駅から「南54真駒内線」「南55藻岩線」あるいは地下鉄東西線西11丁目駅から「南4・南54・南64真駒内線」より乗車(所要時間それぞれ約20分、約15分)、バス停「南27西11」下車、徒歩約3分
    • 札幌駅バスターミナルから「定山渓線」より乗車(所要時間約20分)、バス停「南27西11」下車、徒歩約3分

    定鉄バスのホームページ

  • タクシー
    JR札幌駅前から「北海学園大学工学部(石山通り沿い南26条)」まで(所要時間約15分)北海学園大学山鼻キャンパスの近隣地図

◎問い合わせ先

  • 研究会に関すること
    内元清貴(情報通信研究機構)
    Tel: (0774)98-6834, Fax: (0774)98-6961
  • 会場に関すること
    越前谷博(北海学園大学)
    Tel: 011-841-1161 (Ext.7863), Fax: 011-551-2951

【プログラム】(発表件数30件)

7月15日(木) ― 10:00 ~ 17:30 ―
 [10:00 ~ 12:05] ● 意味表現・データマイニング   〔5件〕
 [13:30 ~ 15:35] ● 情報抽出・翻訳知識獲得     〔5件〕
 [15:50 ~ 17:30] ● 機械翻訳            〔4件〕
7月16日(金) ― 09:00 ~ 17:30 ―
 [09:00 ~ 10:40] ● 語彙的知識獲得         〔4件〕
 [10:55 ~ 12:10] ● 質問応答            〔3件〕
 [13:30 ~ 15:10] ● セグメンテーション・要約    〔4件〕
 [15:25 ~ 17:30] ● 仮名漢字変換・形態素構文解析  〔5件〕


7月15日(木) ― 10:00 ~ 17:30 ―

[10:00 ~ 12:05] ● 意味表現・データマイニング    〔5件〕

  1. 暦に基づく時間指示表現に対する意味表現形式の提案
      ○溝渕昭二(近畿大学), 安藤一秋(香川大学)

  本稿では,暦に基づく時間指示表現を対象として,その意味を記述
  するための表現形式である時間指示式を提案する.

  1. クエリー駆動方式の文書間極大類比構築法
      ○原口誠, 吉岡真治(北海道大学)

  物語データベース構築のために提案した、共通抽象イベント列構築
  手法の高速化について報告する。

  1. Rethinking Plans and Scripts Realization in the Age of Web-mining
      ○ジェプカ・ラファウ, 伊藤敏彦, 荒木健治(北海道大学)

  New ideas for applications using cognitive science concepts
  which realizing before was impossible due to the technical
  limits.

  1. テキストデータを用いた問題の早期発見手法
      ○宅間大介, 野美山浩(日本IBM)

  非定常な問題を発見するための領域知識の構造化,テキストとの対
  応付け,及び時系列解析の手法を提案する.

  1. 文献からの薬物相互作用情報の抽出に向けて
      ○保坂順子, 吉川澄美, 松村和美, 小長谷明彦(理化学研究所)

  われわれは、構文解析に基づく情報抽出を行っている。”
  metabolize/metabolism”な どの生物文献固有の作用語に着目した
  抽出規則の作成を行っているので、その現状を報告する。

[13:30 ~ 15:35] ● 情報抽出・翻訳知識獲得      〔5件〕

  1. Webページ内の目的部分の自動抽出
      ○新納浩幸, 佐々木稔(茨城大学)

  テキストブラウザを利用してテキスト化し、各行に対する START/
  END 法を行なうことで所望の部分を抽出する。対訳コーパスの自動
  作成に応用する。

  1. メタデータ付与のための住所録自動生成
      ○村山紀文, 南野朋之, 奥村学(東京工業大学)

  固有名に住所情報などを付与するための住所録を、Web上のデータ
  から情報抽出することで自動生成する。

  1. 隣接情報に基づく対訳語の自動抽出手法
      ○越前谷博(北海学園大学), 荒木健治(北海道大学), 桃内佳雄(北海学園大学)

  対訳コーパスから対訳語を抽出する際、対訳語に隣接する単語列を
  利用する手法を提案する。Dice係数に本手法を導入した結果、抽出
  率が向上し、本手法の有効性を確認した。

  1. 日英報道記事からの訳語対応推定: ターム頻度と訳語対応推定性能の相関の評価
      ○日野浩平(豊橋技科大), 宇津呂武仁(京都大学), 中川聖一(豊橋技科大)

  日英報道記事からの訳語対応推定において,ターム頻度が大きいほ
  ど高い 訳語対応推定性能が得られることを実験的に示す.

  1. 日英二言語文書を用いた訳語対応推定: ウェブ上の非対訳文書を用いた訳語候補順位付け
      ○木田充洋, 宇津呂武仁(京都大学), 日野浩平(豊橋技科大), 佐藤理史(京都大学)

  あらかじめ用意された英日の訳語組候補について,ウェブ上の検索
  エンジンにより収集した各言語の(非対訳)文書を用いて,訳語候補
  の順位付けを行なう.

[15:50 ~ 17:30] ● 機械翻訳             〔4件〕

  1. 統計翻訳指標を導入した構文トランスファに基づく用例翻訳
      ○今村賢治, 大熊英男, 渡辺太郎, 隅田英一郎(ATR)

  統計翻訳のモデルを利用して最適訳選択を行う、構文トランスファ
  方式の用例翻訳器を提案する。

  1. アイヌ語名詞句の日本語への漸進的直接翻訳について
      ○桃内佳雄(北海学園大学)

  アイヌ語名詞句の構造とアイヌ語の特徴的な文法機能に依存した漸
  進的直接翻訳の可能性について考察する.

  1. 音韻論的・形態論的制約を用いたモンゴル語句生成
      ○Sanduijav ENKHBAYAR, 宇津呂武仁, 佐藤理史(京都大学)

  少数のモンゴル語句生成規則により句候補を生成し,モンゴル語コ
  ーパス中の事例を検索することにより,句候補の絞り込みを行なう.

  1. 翻訳検証テストのためのストリングリソースID
      ○加藤直孝(日本IBM), 有澤誠(慶應大)

  外部化したストリングリソースすべてにIDを振ることにより、GUI
  上に出力するストリングの出所を明確にする方法を開発し実用化し
  た。

7月16日(金) ―  09:00 ~ 17:30 ―

[09:00 ~ 10:40] ● 語彙的知識獲得          〔4件〕

  1. 慣用句抽出のための統計尺度の比較評価
      ○相薗敏子, 小泉敦子, 森本康嗣(日立製作所)

  複数の統計尺度を用いて文書DBから抽出した文節のペアを順位付
  けし、慣用句抽出という観点から比較・評価した。

  1. 文脈一貫性を利用した極性付評価表現の語彙獲得
      ○那須川哲哉, 金山博(日本IBM)

  組織・製品などに関して好不評を示す表現を、「満足する」「不満
  だ」などの種表現との隣接共起性から、教師なし学習で獲得する手
  法を示す。

  1. 複数の著者の表記の違いを利用した同義表現抽出
      ○村上明子, 那須川哲哉(日本IBM)

  自然言語理解において同義表現の解決が重要 である事を示し、筆
  者による表記の統一性を 利用した同義表現の抽出法を提案する。

  1. Katakana Variants Detection for Information Retrieval
      ○曲衛東, 白井克彦(早稲田大学)

  Word mismatch is a major issue in information retrieval
  task. Traditionally, automatic query feedback or thesaurus
  is used to deal with this problem. However in Japanese
  information retrieval, there is a special case, Katakana
  Variants, which cannot be solved by using query feedback. It
  also cannot be solved completely by using thesaurus since no
  thesaurus contains all possible Katakana Variants. Most of
  works to deal with this problem is based on rewrite rules.
  In this paper we present a knowledge-free method to deal
  with this question. We use orthographic cues and weighted
  semantic similarity to detect the Katakana Variants. Our
  preliminary experiments show the proposed method is useful
  for Katakana Variants detection.

[10:55 ~ 12:10] ● 質問応答             〔3件〕

  1. メーリングリストを利用した質問応答システムのための知識獲得
      ○渡辺靖彦, 園和也, 岡田至弘(龍谷大学)

  メーリングリストに投稿された質問および回答のメールから重要文
  を取り出し、 それらが質問応答システムの知識として役立つこと
  を示す。

  1. New Features for the Question Classification Using Support Vector Machines
      ○Marcin Skowron, Kenji Araki(北海道大学)

  Question Classification is of crucial importance for
  question answering. Support Vector Machines are known to
  work well for sparse, high dimensional problems. However,
  the frequently used bag-of-words approach does not take the
  full advantage of information contained in a question. To
  capture this information we propose three new features:
  subordinate word category, question focus and
  syntactic-semantic structure. As our evaluation shows the
  inclusion of these new features provides higher accuracy of
  question classification, comparing to the classical
  bag-of-words approach and other methods that were described
  in the literature so far.

  1. 質問応答技術は情報アクセス対話を実現できるか
      ○加藤恒昭(東京大学), 福本淳一(立命館大学), 桝井文人(三重大学),
      神門典子(国立情報学研究所)

  対話的情報収集場面で必要となる質問応答技術の能力に関する
  調査結果とその能力を評価するためのタスクの設計を述べる.

[13:30 ~ 15:10] ● セグメンテーション・要約     〔4件〕

  1. 単語の結束度と文の表層情報を組み合わせたテキストセグメンテーション
      ○松井祥峰, 乾伸雄, 小谷善行(東京農工大学)

  従来の手法を組み合わせる方法を提案し、セグメント境界を推定す
  る精度が向上することを実験的に評価する。

  1. 表層表現に基づく重要段落抽出
      ○中野滋徳, 足立顕(富士通), 牧野武則(東邦大学)

  提題と文の連接関係を解析することで文をセグメンテーションする
  手法について述べる

  1. 複数の質問に焦点を当てた複数文書要約手法
      ○森辰則, 野澤正憲, 浅田義昭(横浜国大)

  質問応答エンジンを用いることで、複数文書から、利用者の持つ複
  数の情報要求を満足する要約を生成する手法について述べる。

  1. 文書要約の自動評価法の提案と評価
      ○平尾努(NTT), 奥村学(東京工業大学), 磯崎秀樹, 前田英作(NTT)

  文書の要約結果を自動評価する手法を新たに提案し、従来より提案
  されている自動評価法(ROUGE)との比較を行う。

[15:25 ~ 17:30] ● 仮名漢字変換・形態素構文解析   〔5件〕

  1. 生コーパスからの単語 N-gram 確率の推定
      ○森信介, 宅間大介(日本IBM)

  生コーパスから単語n-gram確率を推定する方法を提案し、 その効
  果を仮名漢字変換を題材として実験的に示す。

  1. シソーラスを用いた派生語の仮名漢字変換の特性
      ○市丸夏樹(九州大学), 中村貞吾(九州工業大学), 日高達(九州大学名誉教授)

  用例とシソーラスを組み込んだPCFGによる派生語の仮名漢字変換に
  おいて, 95%の正解率を得たので報告する.

  1. 単語レベルと文字レベルの情報を用いた中国語・日本語単語分割
      ○中川哲治(沖電気工業), 松本裕治(奈良先端大)

  コスト最小法と文字タグ付け法を組み合わせることにより,高い精
  度で未知語の解析を行う単語分割手法を提案する.

  1. 相対的な係りやすさを考慮した日本語係り受け解析モデル
      ○工藤拓, 松本裕治(奈良先端大)

  従来の統計的係り受け解析の多くは、他の係り先候補とは独立に
  算出される絶対的な係りやすさに基づきモデル化されていた。 本
  発表では、他の候補との係りやすさを相対的に比較するモデル を
  提案し、実データを用いて有効性を検証する。

  1. 節境界に基づく独話文係り受け解析の効率化
      ○大野誠寛, 松原茂樹(名古屋大学), 丸山岳彦(国立国語研究所),
    柏岡秀紀(ATR), 田中英輝(NHK), 稲垣康善(愛知県立大学)

  独話文の係り受け解析を節分割により高速化する手法を提案する.
  本手法では、節レベルと文レベルの二段階で解析を実行する.

プログラムの先頭へ戻る。


作成日:平成16年5月17日