◇ 第140回 自然言語処理研究会

◎日 時 平成12年11月21日(火) 10:00~17:50
22日(水) 10:00~16:50

◎会 場:奈良先端科学技術大学院大学
情報科学研究科A棟L3中講義室
〒630-0101 奈良県生駒市高山町 8916-5

〔交通手段〕
・京都駅から
~JR京都駅(東海道新幹線)
◇京都駅(近鉄京都線) ~ 山田川駅
◇近鉄バス(高山サイエンスタウン行き) ~ 大学院大学
・新大阪駅から
~JR新大阪駅(東海道新幹線)
◇新大阪駅(地下鉄御堂筋線) ~ なんば
◇近鉄難波駅(近鉄奈良線) ~ 学園前駅
◇近鉄バス(高山サイエンスタウン行き) ~ 大学院大学

〔連絡先〕 松本 裕治 (奈良先端科学技術大学院大学 情報科学研究科)
〒630-0101 奈良県生駒市高山町 8916-5
Tel: 0743-72-5240, Fax: 0743-72-5249 ★ 一日目(21日)の終了後、18:00~18:30に奈良先端大 松本研究室の見学を予定しております。

<<>>


【プログラム】(発表件数24件)

  • 11月21日(火) ― 10:00 ~ 17:50 ―
  • 11月22日(水) ― 10:00 ~ 16:50 ―

11月21日(火) ― 10:00 ~ 17:50 ―
[10:00 ~ 12:00] ● チャンキング・要約〔4件〕

(1) 日本語単語分割へのタグなしコーパスとタグ付きコーパスの利用
○新納 浩幸 (茨城大学工学部システム工学科)

タグ付きコーパスとタグなしコーパスから各々決定リストを作成し、
後者を前者の default 規則として用いる。組み合わせた規則の精度を
タグ付きコーパスとブースティングにより高める。

(2) Support Vector Machine を用いた Chunk 同定
○工藤 拓, 松本 裕治 (奈良先端大)

名詞句や動詞句といった任意の Chunk の同定問題をタグ付け問題とみなし,
Support Vector Machine を用いてのそれらの同定を行なう.
さらに, タグの表現方法を変更し, 個々で学習したモデルの
重み付き多数決を行なうことでさらなる精度向上を試みる.

(3) 携帯電話情報サービスのための新聞記事要約の研究
○徳永 秀和 (高松工業高等専門学校制御情報工学科)
青江 順一 (徳島大学工学部知能情報工学科)

携帯電話への情報配信のためには文字数を130文字程度に
抑える必要がある。現在、人手で製作されている要約文を解析し、
自動要約する手法を提案する。

(4) ニュース文の音声要約のための韻律情報の利用
○佐渡 詩郎 (豊橋技科大), 大竹 清敬 (豊橋技科大),
増山 繁 (豊橋技科大), 山本 和英 (ATR音声言語通信研究所),
中川 聖一 (豊橋技科大)

ニュースアナウンサーの発話を音声認識して得た誤りを含む
テキストを韻律情報を利用し要約する

[13:00 ~ 15:00] ● 語彙・概念    〔4件〕

(5) 文ベクトル集合モデルによるテキスト処理
○川谷 隆彦 (日本ヒューレット・パッカード)

文毎に抽出されたベクトルの集合で文書を表し、更に主成分分析を行って
文書の主要な概念を解析する。

(6) コンセプト・プロジェクションにおける関連性フィードバックを
用いた概念ベクトルの更新手法
○佐々木 稔, 獅々堀 正幹, 北 研二 (徳島大学工学部知能情報工学科)

検索結果から得られる関連文書ベクトルによる,次元圧縮に
必要な概念ベクトルの有効な更新手法について述べる.

(7) MDL原理に基づく辞書定義文の圧縮と共通性の発見
○土屋 雅稔, 黒橋 禎夫 (京都大学大学院情報学研究科)

MDL原理を用いて辞書定義文を圧縮することにより、
定義文間に共通する特徴を発見する。

(8) 文書情報からの分野オントロジー構築の支援
○廣田 啓一, 佐々木 裕, 加藤 恒昭
(NTTコミュニケーション科学基礎研究所)

実テキスト集合からの語彙情報収集と人手での編集による
体系化からなる分野オントロジー構築支援システムについて述べる。

[15:20 ~ 17:50] ● 情報・用語抽出  〔5件〕

(9) 複数製品の紹介記事からの製品情報抽出
○赤松 順子 (九工大), 高尾 宜之 (ソニー),
永井 秀利 (九工大), 中村 貞吾 (九工大),
野村 浩郷 (九工大)

複数の製品情報を含む記事について,パターンマッチングによる抽出と
構文解析を用いた抽出との比較実験を行った

(10) 固有表現抽出のための可読性の高い規則の自動生成
○磯崎 秀樹 (NTT)

比較的高精度で可読性の高い固有表現抽出規則群を、正解コーパスから
自動生成する方法を示す。

(11) 単語の部分文字列を考慮した専門用語抽出と分類
○山田 寛康, 工藤 拓, 松本 裕治 (奈良先端科学技術大学院大学)

単語の表層文字、品詞情報に加えて、部分文字列を考慮した専門用語
抽出と分類手法について述べる。

(12) 組み合わせ的確率モデルに基づく特徴単語選択方法
—超幾何分布の応用—
○久光 徹, 丹羽 芳樹 (日立製作所中央研究所)

文書集合中の特徴的な単語を選択する際に,超幾何分布を
応用した確率値を用いることの有効性と,その高速計算方法。

(13) 固有名抽出のための短縮形知識の探索手法
○鈴木 伸哉, 劉 連文, 桝井 文人, 河合 敦夫, 椎野 努 (三重大学工学部)

参照関係解析のために,括弧付きパターンを利用して,英文短縮形と
固有名の対応関係を探索する.

11月22日(水) ― 10:00 ~ 16:50 ―
[10:00 ~ 12:00] ● 意味論      〔4件〕

(14) 心像意味論のためのHPSGの意味原理について
○笠 晃一, 弘中 大介, 横田 将生 (福岡工業大学)

心像意味論による意味記述をHPSGによって処理するために必要な
記述形式と意味原理について述べている。

(15) 述語の隣接と述部の付加における意味的階層性
○大谷 朗†‡, 宮田 高志‡, 松本 裕治‡ (†大阪学院大, ‡奈良先端大)

日本語における文末や修飾の巨視的階層性(南1974)を
HPSGに基づく辞の局所的制約として捉え、文解析への
応用を試みる。

(16) 文間の時間制約モデルと事象の時系列化への応用に関する研究
○小倉 牧人, 田村 直良 (横浜国立大学大学院工学研究科)

時間に関する表現モデルにより、事件など事象に関する新聞文書を
時間に関して再構造化し、時系列化など文書処理への応用を目指す。

(17) 分野連想語の出現位置に基づく話題分野の特定手法
○獅々堀 正幹, 岡田 真, 池田 俊彦, 青江 順一 (徳島大学工学部)

複数話題が混在する文書に対して,予め定義した分野体系に
従って,各話題分野毎の領域を特定する手法を提案する.

[13:00 ~ 14:30] ● 構文解析     〔3件〕

(18) 用言と直前の格要素の組を単位とする格フレームの自動獲得
○河原 大輔, 黒橋 禎夫 (京都大学大学院情報学研究科)

用言と直前の格要素の組を単位として例文を収集し、それらを
クラスタリングすることによって格フレームの自動獲得を行う。

(19) Support Vector Machine による英語係り受け解析
○宮田 高志, 山本 薫, 松本 裕治 (奈良先端大)

日本語の「文節」に相当する単位を英語に導入することで
句構造を文節間依存構造に変換し、これをSVMで学習する
ことにより係り受け解析器を作成した。

(20) 形態素係り受けモデルによる形態素解析と構文解析の同時処理
○森 信介, 西村 雅史, 伊東 伸泰, 荻野 紫穂, 渡辺 日出雄
(日本IBM東京基礎研究所)

形態素を単位とする係り受けを表現する隠れマルコフモデルを提案する。
このモデルを用いれば、文字列の生成確率を計算することができるので、
音声認識や構文解析などに応用できる。応用例として、文字列を入力と
する構文解析について述べる。

[14:50 ~ 16:50] ● 検索・応用    〔4件〕

(21) 事典情報を利用した文書検索支援について
○高野 敦子 (兵庫大学経済情報学部)
平井 誠  (大阪市立大学情報工学科)
北橋 忠宏 (大阪大学産業科学研究所)

ユーザの示した検索条件を拡張し,それを使って抽出した文書を
分類することにより,ユーザの潜在的要求の定式化を図る.

(22) 自然言語で表現されたプロダクションルール条件文の解釈
○田島 久彰 (NTTサイバースペース研究所)

自然言語で記述された条件文を,計算機で解釈可能な
表現に変換する方法を提案する.

(23) パソコン参考書用の点訳プログラムと応用
○相川 哲弥 (岡山大学)

パソコンの参考書やマニュアルを紙や点字ディスプレイに点訳出力する
プログラムの製作と効率的応用

(24) 固有表現を回答する日本語質問回答システム
○賀沢 秀人, 加藤 恒昭 (NTTコミュニケーション科学基礎研究所)

人名・地名などの自然言語文による問い合わせに対し、新聞記事を
手掛かりに回答するシステムを作成した。

プログラム先頭へ戻る.


照会先:松本 裕治, 宮田 高志 (奈良先端大)
作成日:平成12年11月6日