◎ 日 時 平成14年9月17日(火) 14:00~16:20
18日(水) 10:00~17:20
(情報処理学会 情報学基礎研究会(FI)と合同開催)
◎ 会 場: 独立行政法人 国立国語研究所 1号館5F講堂
〒115-8620 東京都北区西が丘3-9-14
◎ テーマ: 「情報活用を目指した自然言語処理」その他一般
バイオや特許などの特定ドメインを対象とする場合、それぞれ特有 の情報活用法が想定され、それに適した特有の言語処理技術が必要 になると考えられます。今回のテーマは、そのような技術に焦点を 当てたいとの思惑と、特有の技術や特定ドメインに限らずもっと広 く一般的なテキストマイニングなども視野に入れたいとの思惑から 設定されました。
〔交通手段〕1:都営地下鉄板橋本町駅下車(徒歩10分)
2:JR埼京線赤羽駅下車(バス約8分)
3:JR埼京線十条駅下車(タクシー約5分)
4:JR埼京線十条駅下車(徒歩約20分)
〔連絡先〕山口昌也(国立国語研究所 研究開発部門第一領域)
Tel:03-5993-7635, Fax:03-3906-3530
【プログラム】(発表件数14件)
9月17日(火) ― 14:00 ~ 16:20 ―
[14:00 ~ 16:20] ● 機械翻訳・対応付け 〔4件〕
9月18日(水) ― 10:00 ~ 17:20 ―
[10:00 ~ 11:45] ● 対話・情報抽出・基礎 〔3件〕
[11:45 ~ 12:00] ★ 山下記念研究賞表彰式(情報学基礎研究会)
[13:00 ~ 14:45] ● 語彙・言語知識獲得 〔3件〕
[15:00 ~ 17:20] ● 文書検索・分類 〔4件〕
[14:00 ~ 16:20] ● 機械翻訳・対応付け 〔4件〕
1. 情報検索システムを利用した日英対訳語推定
○鈴木健二, 梅村恭司(豊橋技術科学大学)
情報検索システムの出力結果から対訳語候補を推定する方法を提案
し,評価実験を行ったので報告する
2. 日本語-ウイグル語辞書の自動作成とその収録語の分析
○ムフタル・マフスット, 小川康弘, 杉野花津江, 稲垣康善(名古屋大学)
著者らは,既存のウ-日辞書を基にして,見出し語数約2万の日-ウ
辞書を半自動的に作成した.この辞書の収録見出し語の特性を明
らかにするために,国立国語研究所の日本語基本語彙2000語,EDR
日本語テキストコーパスの出現頻度上位2000語に対し,日-ウ辞書
のカバー率の調査,及びカバーされなかった単語の分析を行った.
3. 日英新聞記事の対応付けと精度評価
○内山将夫, 井佐原均(通信総合研究所)
読売新聞とThe Daily Yomiuri との記事対応および文対応を得たの
で,その手法および精度を報告する.
4. ローカルアラインメントによるテキスト間の柔軟な対応付け
丸川雄三,○岩山真,奥村学,新森昭宏(東京工業大学)
DPマッチングによりテキスト間のローカルアラインメントを求め,
様々なテキスト処理に応用する方法を述べる.
[10:00 ~ 11:45] ● 対話・情報抽出・基礎 〔3件〕
5. 情報量に基づく帰納的学習による音声対話処理手法の性能評価
○木村泰知, 荒木健治(北海道大学), 栃内香次(北海学園大学)
帰納的学習において共通部分の定義は獲得規則に大きく影響する.
情報量に基づき共通部分と差異部分を決定することで,対話例か
ら効率的に応答規則を獲得する手法を提案し,評価実験を行った.
6. HTMLの表形式データの変換と携帯端末表示への応用
○塚本修一, 増田英孝(東京電機大学), 中川裕志(東京大学)
Webページ上の表に対して,属性名と属性値の切り分けを行なうシ
ステムを実装し,評価を行なった.
7. 構造をもつ特徴を有するデータ間の類似度計算
○佐藤慶三,中島誠,伊藤哲郎(大分大学)
データは,一般にキーワードだけでなく格納先など構造をもつ特徴も有する.
この特徴も利用し,データ間の類似度を求める測度を定式化する.
[13:00 ~ 14:45] ● 語彙・言語知識獲得 〔3件〕
8. EMアルゴリズムの最適ループ回数の予測を用いた語義判別規則の教師なし学習
○新納浩幸, 佐々木稔(茨城大学)
EM による教師なし学習では精度が逆に悪化する場合もある.ここ
では EM の 最適ループ回数を予測することで,精度低下を避ける.
SENSEVAL2 の辞書タスクの名詞に適用し 78.56% の正解率を得た.
9. 類義語のオンライン検索
○伊東秀夫((株)リコー ソフトウェア研究所)
文書検索の際に,検索者が与えた任意の検索語に対し,検索対象文
書群からその類義語候補をオンラインでランキング検索するための
手法を提案し,NTCIRテストコレクションを用いて性能を評価する.
10. 潜在的文脈関連度を用いた検索質問拡張
○佐々木稔, 新納浩幸(茨城大学)
検索を行わずに検索質問から関連語を抽出する手法として,特異値
分解により潜在的意味を考慮した文脈関連度手法を提案する.
[15:00 ~ 17:20] ● 文書検索・分類 〔4件〕
11. WWWにおける有用性の高いページの特定手法について
○野末道子(鉄道総合研究所),安形輝(亜細亜大学),
久野高志(作新学院大学),池内淳(大東文化大学),
石田栄美(国立情報学研究所),上田修一(慶應義塾大学)
Webページに対し,情報源としての有用性という基準で判定を行った.
この判定結果から学習した用語を利用し,検索結果に対する有用性
判断の適用可能性を検討した.
12. 日本語テキストの自動分類のための特徴素抽出法の比較
○石田栄美(国立情報学研究所),辻慶太(国立情報学研究所)
日本語の新聞記事を対象に,形態素解析により抽出した特徴素とN-gramで
抽出した特徴素を用いて,自動分類実験を行い,その性能を比較した.
13. 文献クラスタの概念的特徴づけを用いた文献の自動分類
○中島誠,伊藤哲郎(大分大学)
学習用文献クラスタの概念的な特徴づけによるクラスタ内容の
理解の容易な表現を用いた,文献の自動分類について述べる.
14. 特許検索における文書分類手法の比較評価
○牧田光晴,樋口重人(パトリス),藤井敦,石川徹也(図情大)
検索システムにおける適合文書の絞り込みという観点から
種々の文書分類(クラスタリング)手法を実験的に比較評価した.
照会先:内元 清貴 (通信総研)
作成日:平成14年8月6日