◎日 時 平成15年11月6日(木) 10:00~15:25
7日(金) 9:00~16:55
(電子情報通信学会「言語理解とコミュニケーション」研究会との共催)
◎会 場 独立行政法人 通信総合研究所
けいはんな情報通信融合研究センター 2F 大画面実験室
〒619-0289 京都府相楽郡精華町光台3-5
[交通手段]
電車をご利用の場合の例:
☆近鉄京都線「新祝園駅」またはJR学研都市線「祝園駅」から:
奈良交通バスで10分 「光台3丁目」下車
飛行機をご利用の場合の例:
☆関西国際空港から:
リムジンバスで1時間35分「学研けいはんなプラザ」下車
(http://www2.crl.go.jp/jt/a130/locatja.htm)
◎問い合わせ先
- 研究会に関すること
* 自然言語処理研究会に関する問い合わせ先:
奥村 学 (東京工業大)
Tel: (045)924-5067, Fax: (045)924-5961* 電子情報通信学会「言語理解とコミュニケーション」研究会に関する問い合わせ先:
宇津呂 武仁
〒606-8501 京都市左京区吉田本町
京都大学大学院 情報学研究科 知能情報学専攻
Tel: (075)753-5345, Fax: (075)753-5962 - 会場に関すること
内元 清貴 (通信総合研究所)
Tel: (0774)98-6834, Fax: (0774)98-6961
【プログラム】(発表件数25件)
11月6日(木) ― 10:00 ~ 15:25 ―
[10:00 ~ 11:15] ● インタフェース,対話 〔3件〕
[11:30 ~ 12:45] ● 要約 〔3件〕
[13:45 ~ 15:25] ● 分類,クラスタリング,機械学習〔4件〕
この日は終日, 通信総合研究所 けいはんな情報通信融合研究
センターにおいて, けいはんな地区NL研究グループ展示会が
開催されています.研究会終了後, 見学の時間を設けました.
11月7日(金) ― 9:00 ~ 16:55 ―
[ 9:00 ~ 10:40] ● 構文,係り受け解析 〔4件〕
[10:55 ~ 12:10] ● 獲得,辞書 〔3件〕
[12:10 ~ 12:20] ● 山下賞授賞式
[13:20 ~ 14:35] ● 多義性解消 〔3件〕
[14:50 ~ 16:55] ● 抽出,マイニング 〔5件〕
[10:00 ~ 11:15] ● インタフェース,対話 〔3件〕
1. 感性検索シーンにおける自然言語IFとGUIの比較評価
○熊本忠彦, 太田公子(独立行政法人通信総合研究所)
印象に基づく楽曲検索システムに自然言語IFとGUIを実装し,
検索性能と使い勝手を比較評価したので,報告する.
2. コミュニケーション支援を目的とした帰納的学習によるペットを
対象とした対話処理手法の性能評価
○前田宏幸, 荒木健治(北海道大学), 栃内香次(北海学園大学)
対話処理手法の入力として,人間の発話に加えてペット動物の状態
を利用したことの影響について述べる.
3. 再帰チェーンリンク型学習を用いた帰納的学習による対話処理手法の
複数被験者による性能評価
○西沢洋一, 荒木健治, 越前谷博, 栃内香次 (北海道大学)
雑談を対象とした対話処理システムを二種類の学習を用いて実現し,
複数被験者による性能比較実験を行う.
4. 係り受け木を用いた日本語文書の重要部分抽出
○伊藤潤(早稲田大学), 酒井哲也(東芝), 平澤茂一(早稲田大学)
日本語文を係り受け木で表されることに着目し,重要部分抽出問題
を係り受け木の部分木の最適化問題に帰着させる.そして、その最
適化問題を解くアルゴリズムを提案する.
5. 文書要約における抽出単位と評価法についての考察
○賀沢秀人(NTT), Thomas Arrigan(Trinity College Dublin),
平尾努, 前田英作(NTT)
文章の結束性を保ちながらも重要な情報を抽出するように
discourse unit を選択する指針を、複数の被験者が作成したデー
タにもとづき議論する。
6. 言語パターンに着目した複数文書要約
○平尾努, 鈴木潤, 磯崎秀樹, 前田英作(NTT)
トピックに特徴的な言語パターンを用いて重要文を抽出する。 ま
た、抽出した文集合の冗長度合を削減する手法についても述べる。
[13:45 ~ 15:25] ● 分類,クラスタリング,機械学習 〔4件〕
7. 共通性分析による文書クラスタリングの評価
○川谷隆彦(日本ヒューレット・パッカード)
標記につき、TDT2コーパスにおける約7500文書を用いた評価実験で
良好な結果が得られたので報告する。
8. カーネル関数によるカテゴリ構造のモデル化
○高村大也(東京工業大学), 松本裕治(奈良先端大), 山田寛康(北陸先端大)
分類問題における負例集合は正例集合より大きく、多様性も高いこ
とが多い。 その事実に着目して、カテゴリの確率分布からカーネ
ル関数を導く。 ここでは特に文書分類において提案したカーネル
関数の効果を検証する。
9. 部分木を素性とする Decision Stumps と Boosting Algorithm の適用
○工藤拓, 松本裕治(奈良先端大)
XML文書 や 構文解析済文といった「半構造化テキスト」の分類に
向け、 部分木の有無に基づく Decision Stumps とそれらを弱学習
器とする Boosting Algorithm を提案する. また, 弱学習器の効率
良い学習手法, および Tree Kernel に基づくSVM との関連性につ
いて言及する。
10. 機械学習のための組み合わせ素性の選択基準について
○磯崎秀樹, 平尾努, 鈴木潤(NTT)
自然言語処理で機械学習を用いる際に、複数の素性を組み合わせた
素性の導入により性能を向上させるための選択基準について提案を
行う。
[9:00 ~ 10:40] ● 構文,係り受け解析 〔4件〕
11. 係り受け関係に基づくグラフ構造を用いた質問応答システム
○倉田岳人, 岡崎直観, 石塚満(東京大学)
質問文に含まれるキーワードと解答候補のグラフ構造内における距
離に従い、適切な解答候補を選択することの有効性を報告する。
12. Support Vector Machineに基づくf-structureの選択
吉村宏樹, ○増市博, 大熊智子, 杉原大悟(富士ゼロックス)
Lexical Functional Grammarに基づく日本語解析システムの解析結
果を対象として、Support Vector Machineによる曖昧性解消実験を
行った結果を報告する。
13. 接続助詞の結合順位に基づく複文の構文解析
○市丸夏樹, 飛松宏征(九州大学)
接続助詞や機能語の線形結合順位をコーパスから求め、構文解析解
の優先付けに用いる手法を提案する。
14. ページ内の意味的係り関係に基づくWWWページ検索結果の絞り込みについて
○松本章代,小西達裕,高木朗,小山照夫,三宅芳雄,伊東幸宏
(静岡大学,(株)CSK,国立情報学研究所,中京大学)
Webページの文章中における検索キーワード間の意味的係り受け
関係を利用し検索精度向上を目指す。
15. HTML文書からの単語間の上位下位関係の自動獲得
○新里圭司, 鳥澤健太郎(北陸先端大)
与えられた単語集合に共通した上位語を,パターンによる抽出では
なくDF及びIDFにより求める手法を提案する.
16. 遺伝的アルゴリズムを用いた帰納的学習による言語と行動の組からの
言語獲得手法の評価
○福井裕隆, 荒木健治(北海道大学), 栃内香次(北海学園大学)
自然言語を用いてロボットに命令することを想定し,言語から行動
への変換規則を学習する手法とその評価について述べる.
17. 電子機械速記「CAVER」における速記反訳辞書設計の発想と内容
○兼子次生, 小谷征勝, 鈴木務, 加古修一
(速記懇談会、速記科学研究会、社団法人日本速記協会)
手書き速記は、一種の符号化を行い、最少図形に最大情報を載せる
研究を行ってきた。近年即時性が要求される速記反訳は手書き速記
の最大の課題であり、発表者らは手書き速記理論を機械速記へ適用
し、さらに電子反訳を行う前提で符号処理体系を最近開発した。速
記者という人間を主体に、機械との協調関係により、リアルタイム
に近い速記符号反訳をねらう。パソコン可読の符号生成規則を紹介
する。時間があれば実演を行いたい。
18. Improving Word Sense Disambiguation by Pseudo Training Data
○Wang Xiaojie, Matsumoto Yuji(NAIST)
Supervised methods for statistical word sense disambiguation
(WSD) need large quantities of sense tagged samples, sense
tagging for polysemous words is expensive. We suggest a way
to improve quality of WSD in the case of small samples,
where we make use of pseudo samples to enhance features and
lower the severity of data sparse.
19. 多項分布と一様分布の混合分布による語義の事前分布の推定
○新納浩幸, 佐々木稔(茨城大学)
観測データからは多項分布が妥当であることをAICを用いて示す。
また観測データを用いない 一様分布による考え方も示す。それら
を混合分布により組み合わせる。Senseval2 日本語辞書 タスクで
評価する。
20. 辞書定義文を用いた低頻度語のための語義曖昧性解消モデルの学習
○白井清昭, 八木恒和(北陸先端大)
低頻度語は機械学習のための訓練データを確保することが難しい。
この問題を解決するために、辞書定義文から抽出された上位概念を
用いる手法を提案する。
[14:50 ~ 16:55] ● 抽出,マイニング 〔5件〕
21. 生物医学文献からの遺伝子機能フレーズの抽出
○平博順, 泉谷知範, 平尾努, 磯崎秀樹, 前田英作(NTT)
生物医学文献中の機能の記述に特徴的なパターンを用いて、遺伝子
の機能を記述した重要なフレーズを抽出する。
22. Webマイニングによるオントロジー構築
○ラタナチャイソムバットシーソムブン(東京大学),
松尾豊(産業技術総合研究所), 石塚満(東京大学)
検索エンジンと自然言語処理技術をを利用し、Webページから自
動的にクエリーに関するオントロジーを構築する手法を提案する。
23. 頻出部分文字列のマイニング
○坪井祐太(日本IBM)
N-gram頻度のカウントを頻出パターンマイニング問題の文脈で捉え
なおし、高速かつ少ないメモリで解くアルゴリズムを提案する。計
算機実験により、Suffix Tree (Ukkonen, 1995)を使用する方法に
比べて高速であることが確かめられた。また、提案手法とN-gram
Prefixspanアルゴリズム(工藤ら, 2002)との関係も示す。
24. 単語の意味関係を抽出する統計モデル選択についての考察
–ベイズ統計に基づく単語の意味関係抽出–
○川前徳章, 鈴木英明, 水野修(NTT)
本研究は単語間の意味と数理モデルの関係を明らかにすることを目
的とする。これらの関係が明らかになることで、必要とされる単語
間の意味関係を抽出できるようになる。その結果、検索システムな
どを含む計算機が文書の内容をより高い精度で扱えるようになり、
ユーザの検索の効率化だけでなくSemantic Webの実現にも寄与する
ことが期待できるようになる。
25. 局所着目方式によるアイヌ語-日本語名詞対訳語の抽出について
○越前谷博(北海学園大学), 荒木健治(北海道大学),
桃内佳雄, 栃内香次(北海学園大学)
日本語文に対する品詞情報とコロケーションに関するヒューリス
ティックのみを用いて、少量のアイヌ語-日本語対訳コーパスから
名詞対訳語を抽出する手法を提案する。
作成日:平成15年9月13日