◆ 第121回自然言語処理研究会

☆ 情報学基礎研究会(FI)との一部合同開催

◎日 程 平成9年9月11日 (木) 10:00 ~ 17:30(FIは15:30から)
12日 (金) 9:30 ~ 17:30(NLは15:00まで)

◎会 場 慶應義塾大学 矢上キャンパス 12 棟 211 番教室

〔交通手段〕JR横浜駅または JR渋谷駅から東急東横線にて 「日吉」下車、徒歩 15 分。
詳細は 会場案内 を参照下さい。

〔連絡先〕
慶應義塾大学 理工学部 情報工学科 中西研究室
延澤 志保
〒223 神奈川県 横浜市 港北区 日吉 3-14-1
TEL: 045-563-1141 ex.3765
FAX: 045-563-3421


【プログラム】

(発表件数20件)


9月11日 ― 10:00 ~ 17:30 ―
[10:00 ~ 12:00] ● 形態素解析・他 (NL単独)

(1) 分類木を用いた日本語文の自動文節分割
○張玉潔、尾関和彦(電通大)

〔概要〕形態素解析された日本語文を、分類木により文節単位に
分割する方法を提案する。この方法は、分割規則をコー
パスから自動的に獲得することができる。

(2) 単語頻度の再推定による自己組織化単語分割
○永田昌明 (NTT)

〔概要〕小さな単語辞書と大量のプレーンテキストから日本語の
単語分割プログラムを自動的に作成する方法について。

(3) 共起情報と統計的形態素解析によるOCR誤り訂正
◯竹内孔一、松本裕治(奈良先端大)

〔概要〕コーパスから形態素解析器を用いて
形態素列分布、単語の共起分布を獲得し、
文字列分布と併用してOCRの誤りを訂正する。

(4) 自由記述答案の採点
○脇田早紀子(日本IBM)

〔概要〕学生が日本語で記述した答案に、必要なポイントが記述されているかを
調べるシステム。正解の登録を容易にするよう工夫する。

プログラム先頭へ戻る.

[13:00 ~ 15:00] ● 構文解析 (NL単独)

(5) MSLRパーザにおける未定義語処理の一方式
○伍井啓恭(EDR)、植木正裕(東工大)、相川勇之(三菱電機)、
杉山健司(EDR)、田中穂積(東工大)

〔概要〕膠着語である日本語を対象とした未定義語の処理を
一般化LR法において実現する方式について述べる。

(6) 構文情報と意味情報からの構文規則の獲得
○小島丈幸、乾伸雄、小谷善行(東京農工大)

〔概要〕構文構造と意味構造をタグ付コーパスから生成する規則を定義し、
生成例からその解析規則を獲得する。

(7) GLRパーザの効率化に関する研究
○植木正裕 徳永健伸 田中穂積

〔概要〕冨田による一般化LR法のアルゴリズムを改良し、スタックの圧縮・
共有を完全に行なうことで、空間的・時間的効率化を図る。
(8) 係り受け情報を利用したパーザの効率化とロバスト解析への応用
○今一 修,藤尾 正和,山根 洋平,宮田 高志,松本 裕治(奈良先端大)

〔概要〕係り受け情報を用いることによりパーザに尤もらしい結
果を優先処理させる枠組みとその応用について述べる.

プログラム先頭へ戻る.

[15:00 ~ 17:30] ● 検索技法 (合同)

(9) 形態素解析を用いた中間部分一致検索の高速化手法
○奥 雅博、野田 良輔、林 智定

〔概要〕単語を単位としたPATと同様な階段状インデックスを派生させた
中間部分一致検索の高速化手法について報告する。

(10) 長い日本語表現の高速類似検索手法
○田中英輝 (NHK)

〔概要〕本稿では共出現単語数に基づいた3つの類似表現検索手法について議論する。
これらは1)語順を考慮しないもの,2)語順を考慮するもの,3)語順と単
語間距離を考慮するものである。

(11) 単語の出現位置情報を用いたコーパスからの
コロケーションの自動抽出
○小田 裕樹 北 研二 (徳島大)

〔概要〕コーパス中の各単語の位置情報を用いて,任意の文中の
コロケーションを連続型・不連続型の別に自動抽出する
手法を提案する.

(12) Suffix Array を用いたフルテキスト類似用例検索
◯山下達雄、松本裕治 (奈良先端大)

〔概要〕Suffix Array を用いて疑似的に TRIE を実現し、それによる
フルテキストを対象とした類似用例検索の方法について述べる。

プログラム先頭へ戻る.

9月12 ― 9:30 ~ 15:00 ―