◆ 第136回 自然言語処理研究会(NL) ◆ 第 57回 情報学基礎研究会(FI)

◎日 時 平成12年3月21日(火) 10:15~16:45
22日(水) 10:15~16:45

◎会 場 横浜国立大学 工学部 大学院工学研究棟7階 大会議室
(〒240-0067 横浜市保土ヶ谷区常盤台79-5)

〔交通手段〕

  1. 横浜駅西口から横浜国大行きバスで約20分
    (横浜市営バス:横浜新道または横浜国大前で下車,相鉄バス:横浜国大で下車).
  2. あるいは,横浜市営地下鉄の三ツ沢上町駅から徒歩20分.
  3. あるいは,相模鉄道線の和田町駅から徒歩20分.

詳しくはhttp://www.ynu.ac.jp/ynu/Campus-2.html参照。

〔連絡先〕

  • 森 辰則 (横浜国立大学 工学部)
    〒240-0067 横浜市保土ヶ谷区常盤台79-5
    Tel: (045)339-4132

【プログラム】

(発表件数20件)

議 題  自然言語処理と情報検索・文書処理


3月21日(火) ― 10:15 ~ 16:45 ―
[10:15 ~ 11:45] ● 情報検索

(1) 適合性フィードバックの効率化について
○岩山真(日立)

少ない適合性判断数で効率良くフィードバックを行なうための手法を比較
検討する.

(2) 構造化文書における全文検索手法の検討
○井形伸之,難波功(富士通研)

全文検索エンジンをベースとした構造化文書検索手法の中のいくつかの手
法について、速度性能・インデックス容量の観点から比較検討する。

(3) 文字コードに依存しない情報検索の実現
◯内田淳,梅村恭司,中川聖一(豊橋技科大)

ビットマップ形式の画像に対する図形検索技術を考案した.また,画像を
扱う際に問題となる計算量の軽減を実現した.

[13:00 ~ 14:30] ● 文書分類・概念ベース

(4) 語と文書の共起に基づく「特徴量」の定義と適用
○相澤彰子(学情センター)

語および文書の共起関係に注目し,特徴語抽出やテキスト分類における
「特徴」の量的表現やその適用について,情報理論的な観点から考察を
加える.

(5) 文書自動分類のための分野間連語辞書
○呉勇,山田祥,岸本洋次郎(日本大)

自動分類のための分野関連語辞書を作り、新聞記事を自動分類した結果、
約80%の分類精度を得られました。さらに、辞書間の距離と分類誤り率
の関係を明らかにした。

(6) コーパスを用いた概念ベース拡張方式
◯稲子希望,笠原 要,松澤和光(NTT)

国語辞典から構築され、単語の類似性判別が可能である概念ベースに対し、
コーパスを利用して、扱える語彙を拡張する方法を提案する。

[14:45 ~ 16:45] ● 言語知識・言語分析

(7) 決定リスト,用例ベース,排反な規則を用いたコーパス誤り検出・誤り訂正
○村田真樹,内山将夫,内元清貴,馬青,井佐原均(通信総研)

排反な規則の作成に大きな障害となるコーパス中の誤りを検出・訂正する.

(8) Extracting German translations of Japanese compound nouns
from a non-parallel corpus
○ Oliver Cromm (千葉大)

Aimed at machine translation, a database of translations was
established. As target expression, not only compound nouns,
but also noun phrases with adjectives or genitive attributes
were taken into consideration.

(9) 多項関係としての格標識共起知識の獲得
○永井秀利,中村貞吾,野村浩郷(九工大)

動詞と単一の格標識との共起ではなく,一文を構成する複数の格標識の組
との共起知識の獲得について述べる.

(10) 語彙の制約を考慮した複合語解析モデルの構築
○竹内孔一,内山清子,吉岡真治,影浦峡,小山照夫(学情センター)

主辞がサ変名詞である2単語からなる複合語に対して、文法的
枠組を考慮した複合語解析モデルの構築を検討する

3月22日(水) ― 10:15 ~ 16:45 ―

[10:15 ~ 11:45] ● 文書処理

(11) 段落中の接続関係と段落間の重要度配分による文章要約
○小堀誠,田村直良(横浜国大)

汎用性のある要約システムの実現にむけて、題名の原理による自動要約を
行なう手法の提案と実装

(12) 文書作成過程の自動蓄積とその文章化
○奥村明俊,池田崇博,佐藤研治(NEC)

文書作成において利用された情報源と操作を文書作成ノウハウとして自動
蓄積し、類似文書に関してノウハウを要約文の形で提示する。

(13) 意味保存型の情報ハイディング —日本語文書への適用—
○三瓶光司,中川裕志,松本勉,村瀬一郎(横浜国大)

意味を変えずにテキストを書き換える方法によって、例えば電子透かしの
ような秘密情報を日本語文書に埋め込む方法について提案、実験、評価を
行なった。

[13:00 ~ 14:30] ● 情報抽出

(14) 機械学習と人手作成のパタンを組み合わせた固有表現抽出
○松尾衛,宮本昌幸,森辰則(横浜国大)

複数の抽出法を統合する手法についての提案と,機械学習とパタンによる
推定法を組み合わせた固有表現抽出について述べる.

(15) 農林関連文書からの情報抽出とその応用
○剱持和宏,山下竜之,志賀正裕,藤畑勝之,森辰則(横浜国大)

通常の固有表現に加えて,生産物名や数値関連情報などを抽出する手法に
ついて検討する。文書検索への応用についても述べる。

(16) 連接異なり語数による専門用語抽出
○大畑博一,中川裕志(横浜国大)

単語がその前後にいくつの単語を連接して複合語を作るかという尺度を
利用して日本語テキストから専門用語を抽出する方法のNTCIRコレクション
による評価を報告する。

[14:45 ~ 16:45] ● Web検索・ネット応用

(17) ユニコードを用いたN-gram索引の一実現方式とその評価
○原田昌紀,風間一洋,佐藤進也(NTT)

字種によって長さの異なるN-gramを用いた全文検索方式をユニコードベー
スで実装し,WWWサーチエンジンに適用した。

(18) サーチエンジンへの問い合わせの解析
○佐藤進也,原田昌紀,風間一洋(NTT)

WWWサーチエンジンのユーザと、そのユーザが検索に使用したキーワード
という2つのデータを対象とした解析の結果を紹介する。ユーザとその使
用キーワードを、文書とそれが含む語と対比し、二者の類似性について調
べる。また、後者を対象に用いられてきた既存の解析手法を前者に応用し
て得られた結果を紹介する。

(19) Webページからのタイプ別情報抽出・分類方式
○山田洋志,福島俊一(NEC)

ロボットによって収集したWebページから、求人情報や、イベント情報な
どの特定のタイプのページを選別し、各タイプに固有の情報を抽出してペー
ジを分類し、ユーザに提示する方式を開発した。求人情報であれば勤務地
や職種、イベントであれば開催日時や開催地によってWebページを分類し
てユーザに提供することで、ユーザが求めるページを簡単に発見できる。
今回、求人情報ページ、イベント情報ページから、情報を抽出し、地域や
日時によって分類しユーザに提示するシステムを試作した。本システムに
ついて、ユーザインタフェース、情報の抽出精度や処理時間について報告
する。

(20) メールマガジンを利用したホットな話題の自動抽出
○柳瀬隆史,仲尾由雄(富士通研)

本稿では、メールマガジン中で互いに関連する記事群を抽出することによ
り、配信時に話題の中心であった情報を取り出す手法を提案する。

プログラム先頭へ戻る.


照会先:松本 裕治 , 宇津呂 武仁 (奈良先端大)
作成日:平成12年1月5日