◎日 時 平成16年5月13日(木) 13:30 ~ 16:50
14日(金) 10:30 ~ 16:30
◎会 場 東京電機大学(神田キャンパス) 11号館17階大会議室
〒101-8457 東京都千代田区神田錦町2-2
アクセスマップ
◎問い合わせ先
- 研究会に関すること
白井清昭(北陸先端大)
Tel: (0761)51-1216, Fax: (0761)51-1216 - 会場に関すること
山田剛一(東京電機大学)
Tel: 03-5280-3690 (前日まで)
Tel: 03-5280-3632 (当日のみ)
Fax: 03-5280-3592
【プログラム】(発表件数15件)
5月13日(木) ― 13:30 ~ 16:50 ―
[13:30 ~ 15:00] ● 抽出 〔3件〕
[15:20 ~ 16:50] ● 複数文書の処理 〔3件〕
5月14日(金) ― 10:30 ~ 16:30 ―
[10:30 ~ 12:00] ● 検索・多義性解消 〔3件〕
[13:10 ~ 14:40] ● テキスト分類・トピック解析 〔3件〕
[15:00 ~ 16:30] ● 解析 〔3件〕
[13:30 ~ 15:00] ● 抽出 〔3件〕
1. コーパスからのキーワード自動抽出
○金田有二, 藤野昭典, 斉藤和巳, 上田修功(NTTコミュニケーショ
ン科学基礎研究所)
キーワードの性質を統計的に解析し,語の出現文書の類似性を考慮
した,キーワード抽出規準を提案する.
2. 専門用語抽出方法のテストコレクション依存性
○森山聡, 辻河亨, 吉田稔, 中川裕志(東京大学)
種々の専門用語抽出方法が対象とするコーパス及び取り出すべき専
門用語の性質にどのように依存しているかを実験的に検討した
3. 質問応答と,日本語固有表現抽出および固有表現体系の関係につい
ての考察
○市村由美, 齋藤佳美, 酒井哲也, 國分智晴, 小山誠(東芝)
日本語固有表現抽出システムを知識抽出と質問解析に利用した質問
応答システ ムASKMiを開発した.このシステムを用いて,(1) 質問
応答の性能と固有表現 抽出の性能の関係,(2) 質問応答の性能と
固有表現体系の粒度の関係,につい て考察を行う.
[15:20 ~ 16:50] ● 複数文書の処理 〔3件〕
4. 分類の評価や特異文書の検出のための文書群の構造可視化
○岩田具治, 斉藤和巳, 上田修功(NTTコミュニケーション科学基礎
研究所)
文書間の類似度ではなく、文書群の確率モデルに基づく 新たな文
書群の構造可視化手法を提案する。
5. 確率モデルを用いた文書分類体系間の構造マッチング
○斉藤和巳, 上田修功, 金田有二(NTTコミュニケーション科学基礎
研究所)
数値的非線形最適化により、階層構造を持つ異なる文書体系のマッ
チングを求める 新手法を提案する。
6. 事実・意見・知識に焦点を当てた観点に基づく複数文書要約
○関洋平(総合研究大学院大学), 江口浩二, 神門典子(国立情報学
研究所)
報道記事だけでなく社説・コラム記事を含んだ複数ジャンルの記事
集合から,事実重視・意見重視・知識重視の3種類の観点で要約を
作成し,それぞれに適した要約生成手法を提案する。
[10:30 ~ 12:00] ● 検索・多義性解消 〔3件〕
7. 適合フィードバックにおける単語選択法
○藤野昭典, 上田修功 (NTTコミュニケーション科学基礎研究所)
情報検索において、適合・不適合文書の識別誤りを最小化する方法
に基づいた適合フィードバック手法を検討する。
8. 4択クイズを連想問題として解く
○外池昌嗣, 佐藤理史, 宇津呂武仁(京都大学)
問題文中の重要なキーワードと解候補の結び付きの強さをヒット数
を用いて測定し、 4択クイズを解く方法を示す。
9. 多義性解消におけるアライメントスコアの重みの推定について
○山下浩一(浜松大学), 吉田敬一(日本大学), 伊東幸宏(静岡大学)
ペアワイズアライメントを用いた多義性解消において、評価値の重
みを統計的に求める手法を報告する。
[13:10 ~ 14:40] ● テキスト分類・トピック解析 〔3件〕
10. 特許文書の多観点分類について
○田中一成(株式会社富士通研究所)
特許文書を対象に、発明の対象や目的・課題といった観点で自動分
類を行う技術を開発したので報告する。
11. トピックドリフトを支援する新聞記事ナビゲーションシステム
○大熊耕平, 山田剛一, 増田英孝(東京電機大学), 中川裕志(東京
大学)
同一トピックの記事間の差異をユーザに提示し,関連するトピック
の記事群へとナビゲートするシステムを開発した.
12. 多重トピックを表現するテキストモデルの一考察
○上田修功, 斉藤和巳(NTTコミュニケーション科学基礎研究所)
テキストの多重トピックを表現する確率モデルである パラメト
リック混合モデルと混合ディリクレモデルとを 比較考察する。
13. Conditional Random Fields を用いた日本語形態素解析
○工藤拓(奈良先端大), 山本薫(理化学研究所), 松本裕治(奈良
先端大)
Conditional Random Fields (CRFs) (Lafferty 01) を 日本語形態
素解析に適用し, 既存手法 (HMMs, MEMMs) に対する 2つの利点,
1) 柔軟な素性構築が可能, 2) Label/Length Bias に強い, を実
データを用いて検証する.
14. 異表記同語認定のための辞書編纂
○佐藤理史(京都大学)
どの範囲を「表記のゆれ」と認定するかのガイドラインを定め、
JUMAN4.0の 辞書を整理した。編纂した辞書を用いて、京大コーパ
スの表記のゆれを調べた。
15. 優先度学習を用いた自然言語処理
○磯崎秀樹, 賀沢秀人, 平尾努(NTTコミュニケーション科学基礎
研究所)
ゼロ代名詞解消や依存構造解析にランキング学習を用いた結果を報
告する。
作成日:平成16年3月8日