☆ 電子情報通信学会「言語理解とコミュニケーション研究会」との共催
◎日 程 平成8年7月18日(木) 9:45~17:30
19日(金) 9:45~16:30
◎会 場 豊橋技術科学大学 A1棟2階,A1-201号室
JR豊橋駅東口(新幹線と反対側)3番バス乗り場で細谷線(細谷東行き, 技科大行き,福祉村行き)に乗車,「技科大前」下車,約30分.
またはタクシーで25~30分.正門から右手、A棟の右に付随.
〔連絡先〕 豊橋技術科学大学 知識情報工学系 増山 繁
Tel 0532-44-6894 (ダイヤルイン), Fax 0532-44-6873
URL: http://www.smlab.tutkie.tut.ac.jp/~masuyama/
【プログラム】
- 7月18日(木) ― 9:45 ~ 17:30 ―
- [9:45 ~ 11:45] 言語データからの知識獲得とその応用(1)
- [13:00 ~ 15:00] 言語データに基づく言語処理
- [15:30 ~ 17:30] 言語データからの知識獲得とその応用(2)
- 7月19日(金) ― 9:45 ~ 17:00 ―
- [9:45 ~ 11:45] 一般(文法、形態素)
- [13:00 ~ 15:00] 対話
- [15:30 ~ 17:00] 翻訳,システム
☆ 1日目(18日)の終了後、デモ1件と懇親会を予定しています。
(懇親会は当日会場にて受け付け)。
7月18日(木) ― 9:45 ~ 17:30 ―
[9:45 ~ 11:45] ● 言語データからの知識獲得とその応用(1)
(1) 補完類似度を用いた固有名詞のグルーピングの試み
松本 兼一, 梅村 恭司 (豊橋技科大)
〔概要〕補完類似度を用いて検索に効果がある固有名詞群を選出する方法を
試みた.その結果を報告する.
(2) 固有名詞に着目して,新聞記事を整理分類し,提供するシステム
増田 恵子, 梅村 恭司 (豊橋技科大)
〔概要〕新聞記事の分類として固有名詞に着目し,記事を整理分類し,
提供するシステムをWWW上に作成した.記事は,時間・空間・ラベルで分類した.
(3) 隣接文字情報を用いたn-gram抽出文字列からの名詞句の自動抽出
下畑 さより, 杉尾 俊之 (沖電気)
〔概要〕n-gram統計による抽出文字列の隣接文字の出現パターンを学習し、
名詞句だけを精度良く抽出する方法について述べる。
(4) 話し言葉用文法のBigramの追加による自動学習法
大谷 耕嗣, 中川 聖一 (橋技科大)
〔概要〕文のカバー率を改善するための文法規則の自動学習法について検討した。
文のカバー率とパープレキシティについて評価を行なった。
[13:00 ~ 15:00] ● 言語データに基づく言語処理
(5) RWCにおける分類コード付きテキストデータベースの開発
豊浦 潤(RWCP), 徳永 健伸(東工大),
井佐原 均(通信総研), 岡 隆一(RWCP)
〔概要〕RWCでは、情報検索などのベンチマーク用に、約3万件の新聞記事に、
国際十進分類法のUDCコードを付与したテキストDBを開発した。
(6)TVニュースと新聞記事の対応づけ
渡辺靖彦(龍谷大学), 岡田至弘(龍谷大学),
角田達彦(京大), 長尾真(京大)
〔概要〕TVニュース中の文字情報を手がかりに、同じできごとを解説する
新聞記事とTVニュースを対応づけする。
(7) 冗長度削減による関連新聞記事の要約
船坂 貴浩(豊橋技科大), 山本 和英(ATR), 増山 繁(豊橋技科大)
〔概要〕関連した内容を記述した複数の新聞記事を重複部分の削除および
文末表現に基づく削除によって要約する。
(8) テキスト構造を利用した主題の推定について
野本 忠司 (日立), 松本 裕治 (奈良先端大)
〔概要〕統計的な類似尺度を用いてテキストの重要部分を決定し、その部分のみ
を利用してテキスト全体の主題の推定を行なう手法について述べる。
フルテキストとの比較を行い、本手法の効果を示す。
[15:30 ~ 17:30] ● 言語データからの知識獲得とその応用(2)
(9) 日英新聞記事の自動記事対応づけ
高橋 大和、白井 諭、藤波 進 (NTT), 池原 悟 (鳥取大)
上田 洋美、松島 英之 (NTTアドバンスドテクノロジ)
〔概要〕数値と企業名をキーワードとして、DBから抽出した日本文記事、
英文記事の記事対応を自動的に行なう手法を提案する。
(10) 置換えを用いた n-gram による言語表現の抽出
内野 一 ,白井諭 (NTT), 池原 悟 (鳥取大), 新田見 緑 (北大)
〔概要〕n-gram による言語表現の抽出において、障害となる文字列を
置き換えることにより収集効率を高める手法を提案する。
(11) 対訳コーパス中の共起頻度に基づく対訳表現の自動抽出
北村 美穂子 (沖電気), 松本 裕治 (奈良先端大)
〔概要〕連続単語の出現頻度と対訳間の同時出現頻度を用いて対訳文書から
文書固有の対訳表現を自動的に抽出する方法を提案する。
(12) 英語テキストからの情報抽出
若尾 孝博(Sheffield大)
〔概要〕近年盛んになりつつある電子化テキストからの情報抽出技術に
関する研究を米国ARPA支援のMUCプロジェクトの成果を
中心に報告する。
<
pre>[9:45 ~ 11:45] ● 一般
(13) 名詞句の文法ー意味自動処理
BLIN Raoul (E.H.E.S.S.-C.R.L.A.O., 筑波大)
〔概要〕日本語の文中の代名詞、指示詞などの名詞句の自動処理を行う際に
データベースを使用し、その名詞句の指示対照の抽出方法を考察する。
(14)確率文脈自由文法が持つ解析木の生成数抑制能力に関する検証
渥美 清隆, 増山 繁(豊橋技科大)
〔概要〕確率文脈自由文法を用いた構文解析で, 付与される確率値の降順に
解析木を選択することによる生成数抑制能力を理論的, 実験的側面から
具体的に検証する.
(15) DFAによる形態素解析辞書の高速化
森 信介 (京大)
〔概要〕形態素解析の辞書を決定性有限オートマトンに変換方法を提案し、
これによる処理速度向上の実験結果を報告する。
(16) 文字・単語n-gramの融合に基づく言語モデル
森 大毅, 阿曽 弘具, 牧野 正三
〔概要〕日本語文書認識のための新しい言語モデルとして、文字のn-gramと
単語の n-gramの複合モデルを提案する。
(17) 対話における統御の概念
川森 雅仁, 島津 明 (NTT)
〔概要〕発話権委譲モデルにかわる対話のモデルとして,統御という概念を
提案し,発話の単位との関係を論じる.
(18) オフライン要求獲得法における「笑い」の利用による「本音」情報の抽出
土井 晃一 (富士通研)
〔概要〕ソフトウエアの要求獲得会議の発話コーパスから「笑い」の情報を
抽出し、会議参加者の本音を推論する。
(19) 反射と熟考の相互作用に基づく協調的対話モデル
長谷川 隆明, 中野 有紀子, 加藤 恒昭 (NTT)
〔概要〕相手の理解度やタイプに応じて説明の仕方を変更できる対話エージェント
の実現に向けて、対話の反射的側面と熟考的側面の相互作用からなるモデルを
提案する。
(20)対話的マルチモーダル説明とその時間的協調
加藤 恒昭, 中野 有紀子, 中嶋 秀治, 長谷川 隆明 (NTT)
〔概要〕装置とその設定について、文章と図面による問い返し質問を許す説明
と指差し等と同期した音声による説明とを生成するシステムを提案する。
(21) 言語類型と機械翻訳
成田 一 (阪大)
〔概要〕言語類型により翻訳率は激変する.「英欧/日韓」「英中/英日」
翻訳ソフトを検証し,言語処理の問題を論ずる.
(22) パソコン参考書を点訳し易い自動点訳製版システムの製作と応用
相川 哲弥 (岡山大)
〔概要〕パソコンから点字製版機を制御する電子回路装置を設計製作して,
点訳製版系を作り,点訳したパソコン参考書点訳書を盲人に実費配布した.