◎日 時 平成16年1月13日(火) 9:30 ~ 17:00
14日(水) 9:00 ~ 17:00
◎会 場 東京大学 附属図書館 大会議室
〒113-0033 東京都文京区本郷7-3-1
アクセスマップ
◎問い合わせ先
- 研究会に関すること
白井清昭(北陸先端大)
Tel: (0761)51-1216, Fax: (0761)51-1216 - 会場に関すること
田中久美子(東京大学)
Tel: (03)5841-2722, Fax: (03)5841-2722吉田稔(東京大学)
Tel: (03)5841-2742, Fax: (03)5841-2745
【プログラム】(発表件数29件)
1月13日(火) ― 9:30 ~ 17:00 ―
[ 9:30 ~ 10:45] ● 抽出(1) 〔3件〕
[11:00 ~ 12:15] ● ツール,質問応答,要約 〔3件〕
[13:20 ~ 15:00] ● テキスト検索,分類 〔4件〕
[15:20 ~ 17:00] ● 辞書,コーパス 〔4件〕
1月14日(水) ― 9:00 ~ 17:00 ―
[ 9:00 ~ 10:15] ● 発話 〔3件〕
[10:30 ~ 12:10] ● 解析 〔4件〕
[13:20 ~ 15:00] ● 抽出(2) 〔4件〕
[15:20 ~ 17:00] ● 言い換え,文法 〔4件〕
[ 9:30 ~ 10:45] ● 抽出(1) 〔3件〕
1. 共起情報に基づく呼応関係自動抽出法の検討
○山本英子(通信総研), 木田敦子(計量計画研), 神崎享子,
井佐原均(通信総研)
呼応関係とは、文中の副詞や係助詞が呼びかけとなり、後続の語が
その呼びかけに応える、語間に存在する関係の一つである。本研究
では、呼要素の候補より後続の形態素ngramを応要素の候補として、
コーパスから呼応関係を抽出する手法を検討する。
2. サポートベクトルマシンを用いたプロフィール情報の抽出
○吉谷仁志, 黄瀬浩一, 松本啓之亮(大阪府立大)
SVMによるセグメンテーション及びクラスタリングを用いて、プロ
フィール情報を抽出する手法について述べる。
3. ソフトウエア製品ニュースからの開発傾向の抽出
○徳永秀和, 天雲勇作(高松工専), 青江順一(徳島大)
support vector machineを用いて,製品の特徴を示すキーワードを
抽出し,抽出もれを補うなどの処理をすることによって,最近の開
発傾向を抽出する。
[11:00 ~ 12:15] ● ツール,質問応答,要約 〔3件〕
4. 構文解析に基づく情報抽出システム開発のためのツール
○保坂順子, Igor V. Kurochkin, 小長谷明彦(理化学研究所)
アノテーション・ツールと構文木の操作ツールを結合させ、アノテ
ーションの変更が構文木上に連動表示されるようにした。結果は、
変換ツールを使ってデータベースに格納できる。また、2種類の抽
出を比較し、その精度を計算することなどもできる。
5. 詳細化された質問タイプによる質問応答システム
○遠藤哲哉, 福本淳一(立命館大)
より詳しい質問タイプの判定を可能とするため、固有表現分類を拡
張・詳細化させたQAシステムを構築し、有効性を評価した。
6. 複数Webページの要約による用語説明の自動生成
○藤井敦(筑波大), 渡邉まり子(図情大), 石川徹也(筑波大)
複数のWebページから個別に抜粋した説明情報を統合し,一つの用
語に関して多面的な観点から概観するための複数文書要約モデルを
提案する.
[13:20 ~ 15:00] ● テキスト検索,分類 〔4件〕
7. クラスタ指向インデクシングに関する一検討
○相澤彰子(国立情報学研究所)
テキスト文書のクラスタを索引づけして検索機能を強化する検索シ
ステムの枠組みや構成法を提案する。
8. NTCIR-4における類似特許検索テストコレクションの構築
○藤井敦(筑波大), 岩山真(東工大/日立), 神門典子(国立情報学研究所)
第4回NTCIRワークショップの特許検索タスクでは,審査官やサー
チャーが行う先願特許調査を代行する検索システムの評価を行って
いる.当タスクの評価用コレクションと予備実験結果について報告
する.
9. 機械学習とルールベースによる職業コーディング
○高橋和子(敬愛大), 高村大也, 奥村学(東工大)
自由回答で表現される職業データのコーディング方法として、ルー
ルベースによる方法と機械学習の一つであるSVMによる方法の有効
な利用法を探る
10. 情報検索における未知語理解支援方式~未知語のシソーラスノードへの分類~
○伊藤俊介, 渡部広一, 河岡司(同志社大)
概念ベースを用いて,未知語が属すべきシソーラスのノードを特定
することにより理解支援を行う.
[15:20 ~ 17:00] ● 辞書,コーパス 〔4件〕
11. 係り受け関係からの格フレーム辞書自動生成システム
○上之薗和宏, 榎津秀次, 古宮誠一(芝浦工大)
係り受け解析に基づく,遺伝的プログラミングによる,格フレーム
辞書生成システムの提案と検証.
12. 「基本語意味データベース:Lexeed」の構築
○笠原要, 佐藤浩史, Francis Bond, 田中貴秋, 藤田早苗(NTT),
金杉友子(NTT-AT), 天野成昭(NTT)
言語処理と心理学の方法論を用いて構築を試みている、種々の意味
研究の基盤データベースについて報告する。
13. 日本語ツリーバンク「檜」: 言語理解のためのコーパス
○Francis Bond, 藤田早苗(NTT), 橋本力(神戸松蔭女子大),
笠原要(NTT), 成山重子(メルボルン大), Eric Nichols(奈良先端大),
大谷朗(大阪学院大), 田中貴秋, 天野成昭(NTT)
統語・意味情報を用いた知識獲得を目指して構築した、日本語
HPSG文法の解析に基づく辞書定義文コーパスについて報告する
14. 精細な文法に基づいたツリーバンク「檜」の構築
○Francis Bond, 藤田早苗(NTT), 橋本力(神戸松蔭女子大),
成山重子(メルボルン大), Eric Nichols(奈良先端大),
大谷朗(大阪学院大), 田中貴秋(NTT)
曖昧性の抑制を考慮した文法拡張を行い、精細な言語情報を持つ
ツリーバンクを構築した結果について報告する。
[ 9:00 ~ 10:15] ● 発話 〔3件〕
15. 言い直しを含む日本語発話の解析手法に関する考察
○原野司, 佐川雄二, 杉江昇(名城大)
解析手法として、文法規則を追加する方法と文字列を比較する方法
を提案した。また、その有効性を確認した。
16. 自然発話中の冗長語区間の判別に関する研究
○丹羽啓二, 佐川雄二, 杉江昇(名城大)
本研究では音声認識システムの誤認識の原因となる長音を含む語を
冗長語とし, 信号処理を用い,除去を行う事を目的とする.
17. 状況を考慮した感情推定方式と感覚語を用いた多様な感情生成法
○風間勇志, 渡部広一, 河岡司(同志社大)
状況知識と語の感覚表現知識を概念ベースやシソーラスで拡大する
ことにより,発話者の多様な感情を推定する方式を提案する
18. ライフサイエンス分野を対象とした低レベルのテキスト処理
○山本薫, 小長谷明彦(理研GSC), 佐藤賢二(北陸先端大)
ライフサイエンス分野テキストの前処理で欠かせない、文分割、わ
かち書き、品詞付与など、低レベルのテキスト処理について、問題
点と開発現状を報告する。
19. 統計的係り受け解析と制約文法の融合による日本語文解析
○東藍, Eric Nichols, 森本芳弘, 松本裕治(奈良先端大)
統計的係り受けを制御情報として制約文法を実相することにより、
スクランブリングや文法誤りを含む日本語文を柔軟に解析する手法
を提案する。
20. 非線形な言語表現と文型パターンによる意味の記述
○池原悟(鳥取大)
言語表現の線形性と非線形性を判定する基準を提案し、非線形な表
現の意味を文型パターンによって記述する方法を検討した。
21. 常識知識を用いた算数問題の意味理解
○稲葉栄美子, 渡部広一, 河岡司(同志社大)
概念ベース,シソーラス,同義・反語辞書および単位などの常識知
識を用い,多様な表現の算数問題の意味理解を行う.
22. 語彙空間の構造に基づく専門用語抽出
○辻河亨, 吉田稔, 中川裕志(東大)
コーパスから抽出した単語からなる語彙空間におけるグラフ構造を
利用した専門用語の抽出方法について報告する。
23. Refining algorithm of pattern rule set for detecting noun phrases in English
Ekaterina Goriouchkina(東邦大), ○足立顕(富士通)
This paper presents a way of increasing accuracy of
detecting English noun phrases with pattern matching. The
present approach is based on a refinement algorithm of
pattern rules extracted from Penn Treebank 3 corpus. The
refined rule set serves as indentification of noun phrases
in English sentence. The algorithm to obtain the best set of
pattern rules is introduced. Some experiments are performed
to evaluate the effectiveness of detecting noun phrases.
24. 係り受けの2部グラフと共起関係を利用した同義表現抽出
○上野友司, 森辰則(横浜国大), 木戸冬子(マイクロソフト), 中川裕志(東大)
多数の文章から完全2部グラフを用いて同義表現の候補を抽出し、
さらにその候補間の類似度を算出する
25. 複合語内外の言語情報を統合的に利用した低出現頻度・辞書未登録訳語対の抽出
○九津見毅(シャープ), 吉見毅彦(龍谷大), 小谷克則(関西外語大/通信総研),
佐田いち子(シャープ), 井佐原均(通信総研)
複合語の訳語を推定するために,複合語内外の言語情報を統合的に
利用し, 各情報に基づいて得られたスコアに対する重みを回帰分
析で決定した.
[15:20 ~ 17:00] ● 言い換え,文法 〔4件〕
26. 依存構造を利用した言い換え文の自動生成
○中野滋徳(東邦大), 足立顕(富士通), 牧野武則(東邦大)
依存ネットワーク構造をトラバースすることにより、エントリを移
動させたときの言い換え文の自動生成を考察する
27. Webと携帯端末向けの新聞記事の対応コーパスからの言い換え抽出
○佐藤大, 岩越守孝, 増田英孝(東京電機大), 中川裕志(東大)
数百文字程度のWeb新聞記事と数10文字程度の携帯端末向け新聞記
事、1年分の文対応付けされたコーパスを用いて、文末表現の縮約
などの言い換えパターン抽出について述べる。
28. 機能表現「なら」の機械翻訳のための言い換え
○松吉俊, 佐藤理史, 宇津呂武仁(京都大)
「なら」を含む文を、日英機械翻訳システムで正しく翻訳できるよ
うに言い換える方法を提案する。
29. 動的計画法に基づく確率文脈自由文法の変分ベイズ法
○栗原賢一, 亀谷由隆, 佐藤泰介(東工大)
確率文脈自由文法に変分ベイズ法を適用する。導出される事後分布
の更新式に動的計画法を適用し効率的なアルゴリズムを導く。
作成日:平成15年11月13日