◎日 時 平成18年1月12日(木)12:15~17:30
13日(金)12:00~17:00
◎会 場 国立国語研究所
〒190-8561 東京都立川市緑町3591-2
[交通手段] (詳細)
多摩都市モノレール 「高松駅」下車 徒歩5分
立川バス 立川駅北口2番のりば 「大山団地折返場」方面行き 「自治大学校・国立国語研究所」下車 徒歩2分
◎問い合わせ先
- 研究会に関する問い合わせ先:
内元 清貴 (NICT)
Tel: (0774)98-6834
Fax: (0774)98-6961 - 会場に関する問い合わせ先:
植木 正裕 (国立国語研究所)
Tel: (042)540-4572
Fax: (042)540-4333
【プログラム】(発表件数19件)
1月12日(木) ― 12:15 ~ 17:30 ―
[12:15 ~ 14:45] ● 言語と画像、類似性の検出 〔5件〕
[15:00 ~ 17:30] ● Web応用 〔5件〕
1月13日(金) ― 12:00 ~ 17:00 ―
[12:00 ~ 14:00] ● 言語資源、コーパス分析 〔4件〕
[14:15 ~ 15:45] ● 機械翻訳 〔3件〕
[16:00 ~ 17:00] ● 抽出 〔2件〕
[12:15 ~ 14:45] ● 言語と画像、類似性の検出 〔5件〕
1. クローズドキャプションを利用した映像主被写体特定手法
○三浦菊佳, 山田一郎, 住吉英樹, 八木伸行(NHK)
被写体を説明する文の特徴から、決定木の信頼度によりカットごと
の被写体名を特定する手法を検討した。
2. 類似画像とキーワードを利用したweb画像の説明文抽出
○竹内謹冶, 黄瀬浩一(大阪府立大)
類似画像に索引付けられたキーワードとHTMLのタグ情報を利用して,
web中の画像の索引付けを行う手法を提案する。
3. 個人文書アーカイブを用いた文書有用性判定タスクとそのための類似判定
○漆畑航太, 梅村恭司(豊橋技術科学大)
ユーザの持つ文書集合をもとに新しい文書が有用であるか判定する
というタスクについて考える。さらに検討したアプローチと実装を
示す。
4. 概念ベースと関連度計算を用いた記事関連度計算方式
○倉田篤史, 渡部広一, 河岡司(同志社大)
単語だけでなく文の構成にも着目し,表記的揺らぎに影響されない
文書間の意味的距離の定量化方式を提案する.
5. 単語出現状況の特徴を用いた英文冠詞誤りの検出及び自動校正
○乙武北斗, 荒木健治(北海道大)
名詞とそれに付属する修飾語句など単語出現状況の特徴を英文コー
パスから抽出し,冠詞誤りを検出及び自動校正するシステムを提案
する.
6. Web資源からの決定木学習によるWebページに対するキーワード付与
○小磯拓也, 但馬康宏, 藤本浩司, 小谷善行(東京農工大)
Webの情報を用いて決定木学習によるキーワード候補からのキーワ
ード選択を行うシステム
7. Web文書を対象とした用語説明文抽出手法における抽出範囲の特定
○土橋惇一, 荒木健治(北海道大)
用語説明文に特有の表現や文同士の関連性を利用し,用語説明文を
抽出する際の範囲を特定する手法について提案する.
8. Webの表を対象とした属性の自動識別
○大前信弘, 黄瀬浩一(大阪府立大)
Webの表から属性を表す行と列を識別することにより属性を自動
抽出する。識別にχ2乗検定を用いている所が特徴である。
9. 言語天文台を設立するための言語判定フレームワークの開発
○中鉢欣秀, Gondri Nagy Janos, Wunna Ko Ko, 三上喜貴(長岡技術科学大)
Webページの使用言語判定と教師テキスト収集のための言語判定フ
レームワークの開発と、その適用例について報告する。
10. Web検索の認知モデルとその支援システム
○鈴木泉, 大里有生(長岡技術科学大)
検索しようとする対象の名称が分からない場合に、それを検索エン
ジンで探すことはたいへん困難である。実際にそのような課題を被
験者に与え、検索エンジンを用いて探し出す課程を観察し、1つの
認知モデルを作成した。このモデルに従って、ユーザーを支援する
システムを提案し、それがどの程度検索効率の向上に繋がるかを実
験によって検証した。
[12:00 ~ 14:00] ● 言語資源、コーパス分析 〔4件〕
11. 生成のための日本語LFG文法の構築
○大熊智子, 増市博, 吉岡健(富士ゼロックス)
解析用パーザのために構築してきた日本語LFG文法を文の生成に適
用する際の課題とその解決方法について検証する。
12. 高性能計算環境を用いたWebからの大規模格フレーム構築
○河原大輔, 黒橋禎夫(東京大学 大学院情報理工学系研究科)
高性能計算環境を利用して、Webから大規模テキストコーパスを抽
出し、格フレームを構築する方法について述べる。
13. Blogにおけるタレント知識とブランド知識に関する発話の収集と分析
○泉田祐樹, 坂本真樹(電気通信大)
Blogから時系列で抽出したタレントとブランドに関する発話内容の
比較により、両知識の影響関係を分析する。
14. レビューにおける「理由」の重要性の分析~被験者実験より~
○中山記男, 神門典子(国立情報学研究所、総合研究大学院大)
レビューを読んで映画を見るかどうかの参考とするとき、テキスト
の中でも我々が定義した「理由」の働きをする部分の重要性につい
て分析を行った。
15. WWW上のテキスト情報を利用した翻訳品質評価法の検討
○宮下広平(同志社大), 安田圭志(ATR), 山本誠一, 柳田益造(同志社大)
機械翻訳による英訳文の品質を,WWW上に存在する英文を利用して
評価する手法に関する検討について述べる.
16. 日中機械翻訳における存在文および関連する問題について
○王軼謳, ト朝暉, 宇野修一, 浅井良信, 池田尚志(岐阜大)
本論文は機械翻訳の角度から、日中両言語における存在文の意味用
法の比較、分析を行い、翻訳規則を提案し、評価した。
17. 言葉の印象に基づく自動翻字手法
○シューリーリー, 藤井敦, 石川徹也(筑波大)
中国語では漢字の音によって外国語を翻字するため,原言語と発音
が似ており,かつ原言語の印象を表す漢字を選択する翻字手法を提
案する.
18. 意見情報の抽出/構造化のタスク仕様に関する考察
○小林のぞみ, 乾健太郎, 松本裕治(奈良先端科学技術大学院大学)
〈対象,属性,評価値〉の組を抽出する意見情報抽出タスクの一般
化として,属性間の階層関係を陽に扱う問題設定を議論する.
19. モンゴル語コーパスからの外来語抽出
○Khaltar Badam-Osor, 藤井敦, 石川徹也(筑波大)
キリル文字のモンゴル語に関する規則を体系化して,モンゴル語コー
パスから外来語を抽出する手法を提案する.
作成日:平成17年11月8日