◎日 時 平成15年3月6日(木) 10:30~17:00
7日(金) 9:00~17:00
◎会 場 徳島大学工学部内 徳島大学工業会館2階 メモリアルホール
〒770-8506 徳島県徳島市南常三島町2-1
〔交通手段〕・ 交通案内
・ 工学部マップ (右上の「工業会館」が会場です)
◎問い合わせ先
- 研究会に関すること
内元清貴(通信総研)
Tel: (0774)95-2425, Fax: (0774)95-2429 - 会場に関すること
獅々堀正幹(徳島大学)
Tel: (088)656-7508, Fax: (088)656-7508
【プログラム】(発表件数27件)
3月6日(木) ― 10:30 ~ 17:00 ―
[10:30 ~ 12:10] ● 情報検索 〔4件〕
[13:25 ~ 14:40] ● 知識表現・アノテーション 〔3件〕
[14:55 ~ 17:00] ● 言語知識獲得 〔5件〕
3月7日(金) ― 9:00 ~ 17:00 ―
[09:00 ~ 10:15] ● 文書分類・クラスタリング 〔3件〕
[10:30 ~ 12:10] ● 情報抽出・質問応答・機械翻訳 〔4件〕
[13:25 ~ 15:30] ● 意味文脈解析 〔5件〕
[15:45 ~ 17:00] ● セグメンテーション・談話構造解析〔3件〕
[10:30 ~ 12:10] ● 情報検索 〔4件〕
1. ダブル配列におけるキー削除の効率化手法
○大野将樹, 森田和宏, 泓田正雄, 青江順一(徳島大学)
トライ法は自然言語処理システムの辞書を中心として広く用いられ
ているキー検索技法で あり,トライを実現するデータ構造に検索
の高速性と記憶量のコンパクト性を併せもつダブル配列構造があ
る.ダブル配列構造の欠点は,キーの削除によって生じる未使用要
素により空間効率が低下する点である.これに対し森田らはダブ
ル配列を詰め直すことにより 未使用要素を除去するキー削除法を
提案した.しかし,この手法は全ての未使用要素を除去できない
ため高い空間効率を維持できず,また削除コストが未使用要素数に
依存するので,削除を連続するほど削除速度が低下するという問
題がある.本論文では,トライの節のうち兄弟をもたない節が多
くの割合を占めること,また,これらの節の遷移は容易に変更で
きるという特徴を利用し,削除を連続した場合でも空間使用率と削
除速度を低下させ ない効率的なキー削除法を提案する.EDR日英単
語辞書,WordNet英単語辞書,日本の郵便 番号リスト,各5万件に
対する実験より,提案法は削除を連続した場合でも極めて高い空
間使用率を維持することが,また,森田らの削除法より50~200倍
高速に削除できることが実証された.
2. Naive Bayesを用いた効率的なWeb検索システムの構築
○西田絵美子, アントニローレンス, ラシキアジョージ(岡山理科大学)
既存の検索エンジンからの結果を選別して知識を獲得し,Naive
Bayesを用いて学習し検索効率を上げる.
3. メール型ヘルプデスク応対記録検索システムにおけるドメインモデルの利用
○伊藤元之(CSK)
検索を言語理解プロセスの一側面と捉える立場に立ち、検索におけ
るドメインモデル導入の有効性について検討する。
4. Non-negative Matrix Factorizationを用いた情報検索モデルの次元圧縮
および検索質問拡張
○好田勳, 柘植覚, 獅々堀正幹, 北研二(徳島大学)
Non-negative Matrix Factorizationを情報検索における次元削減、
および検索質問拡張に用いることを提案する。
[13:25 ~ 14:40] ● 知識表現・アノテーション 〔3件〕
5. 型付き動的論理(TDL)によるイベント量化の分析
○戸次大介(科学技術振興事業団さきがけ研究21/東京大学)
型と意味構造をTDLによって定義した範疇文法を提案し、イベント
の量化に伴う諸問題が解決することを示す。
6. 意味判定が容易な述語知識表現法とそれへの自然言語文の自動変換法
○野中昌行, 花田真理, 石川勉(拓殖大学)
EDR辞書等を利用し,引数にラベル付けを行う述語知識表現法および,
それと自然言語文間の変換法を提案する.
7. 対称モデルに基づく共参照関係アノテーションスキーマ
○川添愛(九州大学/ 国立情報学研究所),
ナイジェル・コリアー(国立情報学研究所)
共参照関係を非依存的・対称的関係とする近年の理論言語学の成果
に基づくアノテーションスキーマを提案し、その有用性について述
べる。
8. 形態素解析とチャンキングの組み合わせによる日本語テキスト中の
未知語出現箇所同定
○浅原正幸, 松本裕治(奈良先端科学技術大学院大学)
統計的形態素解析器の弱点をチャンカーを用いて検出することによ
り未知語の出現箇所を推定する
9. 日本語-ウイグル語対訳辞書拡充のための日本語言い換え処理
○釜谷聡史, 小川泰弘, ムフタル・マフスット 稲垣康善(名古屋大学)
辞書未登録語を補完するために、国語辞書の語義文を基に収集した
言い換え候補を、語構成の見地から選抜する。
10. Web上のテキストコーパスを利用したオノマトペ概念辞書の自動構築
○奥村敦史, 齋藤豪, 奥村学(東京工業大学)
既存のNLP用辞書に不足がちなオノマトペに対し、Web上のテキスト
データをコーパスとみなす概念辞書の自動構築手法を提案する。
11. 共起データに基づく名詞の n 次元空間への配置
○冨浦洋一, 田中省作, 日高達(九州大学)
語 w と関係 f で共起する名詞は,意味的に類似性があると考えら
れる.この類似性を反映するように,名詞をn次元空間に配置する
手法について報告する.
12. テキストマイニングによる評価表現の収集
○小林のぞみ, 乾健太郎, 松本裕治(奈良先端科学技術大学院大学),
立石健二, 福島俊一(NEC)
掲示板記事などの大量のweb文書から意見情報を抽出することを目
的とし,必要となる分野依存の評価表現辞書を共起パタンに基づい
て半自動的に獲得する.
[09:00 ~ 10:15] ● 文書分類・クラスタリング 〔3件〕
13. 多義性を軽減した素性セットによるテキスト分類方式
○荒木淳, 中山雅哉, 中村文隆(東京大学)
本稿では、素性選択後に単語の多義性に着目した素性セットの再選
出を行う手法を提案し、その有効性を検証する。
14. 多文書間の共通性分析による文書クラスタリング
○川谷隆彦(日本HP)
先に提案した多文書間の共通性分析に基づく非階層形のクラスタリ
ング手法を提案し、TDT2を用いた実験結果を紹介する
15. 階層構造を利用したテキスト間類似度の効率的計算法
○鈴木潤, 平尾努, 佐々木裕, 前田英作(NTT)
対象テキストの構造を階層的なグラフ構造と捉えて、2つの対象間
の類似度を効率的に計算する方法を提案する。
[10:30 ~ 12:10] ● 情報抽出・質問応答・機械翻訳 〔4件〕
16. 生物医学質問応答システム(bio-QA)の提案
○平博順, 平尾努, 泉谷知範(NTT), 鈴木穰(東京大学), 前田英作(NTT)
生物・医学分野の研究をすすめるための効率 のよい生物情報提示
システムbio-QAの提案を 行なう.
17. 常識判断システムにおける自然な会話のための質問生成方式
○岩下直人, 渡部広一, 河岡司(同志社大学)
ロボットが自然な質問をできることを目的としている.常識判断シ
ステムを用いて質問を6つのルールにモデル化し評価した.
18. インターネット情報監視システムの試作
○永井明人, 増塩智宏, 高山泰博, 鈴木克志(三菱電機)
Web上で広がる企業風評や製品のクレーム情報を抽出して監視する
試作システムの概要を 述べる。特徴は、(1)精密なクレーム抽出、
(2)クレーム急増検知、(3)大量文書の収集、 である。
19. 翻訳精度評価手法 BLEU の日英翻訳への適用
○金山博, 荻野紫穂(日本アイー・ビー・エム)
n-gram を用いて機械翻訳の性能を客観的に測る手法である BLEU
に対し、類似度の低い言語対においても妥当に比較ができるような
拡張を試みた。
20. HTML形式の表構造の内容解析手法とその応用に関する研究
○大谷貴志, 獅々堀正幹, 柘植覚, 北研二(徳島大学)
HTML形式で記述された表内の各項目間の意味的関係を,教師データ
を用いて解析する手法を提案する.また.その結果を用いた応用シ
ステムについて紹介する.
21. 単語クラスタリングの語義判別問題への応用
○佐々木稔, 新納浩幸(茨城大学)
語義判別を目的としたシソーラスの構築を行うために、 大規模単
語を対象とした単語クラスタリング手法を提案する。
22. 「名詞と表層格」パターンに対する深層格対応の推測
○小山正太, 乾伸雄, 小谷善行(東京農工大学)
動詞は与えず、「名詞と表層格」パターンだけから、対応する深層
格を推測する。「名詞と表層格」パターンの複数入力などにより深
層格候補の絞込みを行う。
23. 機械学習によるゼロ代名詞同定の一方法
○飯田龍, 高村大也, 乾健太郎, 松本裕治(奈良先端科学技術大学院大学)
GDAコーパスを対象にSupport Vector Machines(SVM)を用いて日本
語ゼロ代名詞の先行詞候補間の関係の学習を行う.学習したSVMを
用いて先行詞候補を比較することでゼロ代名詞の同定を行い,その
評価実験について報告する.
24. 対話システムにおける顔文字の学習
○中村純平, 池田剛, 乾伸雄, 小谷善行(東京農工大学)
顔文字付き対話事例から品詞、形態素や感情値などで出力顔文字を
学習し、 対話システムの出力文に適切な顔文字を出力する。
[15:45 ~ 17:00] ● セグメンテーション・談話構造解析 〔3件〕
25. クラスター内変動最小アルゴリズムに基づくトピックセグメンテーション
○別所克人(NTT)
テキストを特異値分解により得られる単語ベクトルの系列ととらえ、
クラスター内変動を基にテキストをトピック単位に分割する方法を
提案する。
26. 繰り返し構造を用いたWebページの構造化に関する研究
○南野朋之, 齋藤豪, 奥村学(東京工業大学)
本研究では,HTML文書中に含まれる繰り返し構造に注目し, 自動
的な情報のセグメンテーション,構造化を行う.
27. Support Vector Machine を用いた談話構造解析
○横山憲司(東京工業大学), 難波英嗣(広島市立大学), 奥村学(東京工業大学)
機械学習アルゴリズムSupport Vector Machineを用いた談話構造解
析を提案し、実験を行った。
作成日:平成15年1月6日