◇ 第142回 自然言語処理研究会

情報学基礎研究会(FI)との合同開催)

◎日 時:平成13年3月5日(月) 9:30~18:30
6日(火) 9:30~17:45

◎テーマ:自然言語処理と情報検索・Web情報管理

◎会 場:NTT横須賀研究開発センタ
〒239-0847 神奈川県横須賀市光の丘1-1

〔交通手段〕
・横浜駅から京浜急行の快速特急で「YRP野比駅」下車(昼間の場合約40分)後、
京浜急行バス「通研行き」または「市民病院行き」にて「通信研究所」下車
(約3キロ, 約10分)。
・「通研行き」には通常のルートと「YRP経由」がありますが、どちらでも
OKです。ただし、乗り場が違うのでご注意下さい。
・詳しくは http://www.ntt.co.jp/cclab/info/access.html をご覧ください。
なお車での御来訪はご遠慮下さい。

〔連絡先〕永田 昌明 (NTTサイバースペース研究所)
〒239-0847 神奈川県横須賀市光の丘1-1
Tel: 0468-59-2796, Fax: 0468-59-4758


【プログラム】(発表件数29件)


3月5日(月) ― 9:30 ~ 18:30 ―
[ 9:30 ~ 12:00] ● 情報検索・用例検索     〔5件〕
(1) Non-negative Matrix Factorization を用いた情報検索
柘植 覚,獅々堀 正幹,北 研二(徳島大)

非負行列Vを同じく非負行列W, Hに分解を行う手法であるNon-negative
Matrix Factorizationを用い、次元圧縮を行い、情報検索精度の向上を
はかる。

(2) ブーリアンクエリのベクトル展開
川谷 隆彦(日本ヒューレット・パッカード)

複数のベクトルを用い、ベクトル空間モデルにおいて索引語間の関係を記述
できるようにする。

(3) 意味理解を用いた判例検索
原田 実,鈴木 亮(青山学院大)

本研究では、日本語意味解析を用いた情報検索の一手法として、本研究室で
開発された意味解析システムSAGEを用い、判例文章を語が格納されたノード
と語間の関係(深層格)を表すアークからなるグラフとして捉え、判例文と問
い合わせ文のグラフ間における位相同型部分の大きさをもとに、文書間の内
容類似度を算出する手法を提案する。

(4) 発話の働きとキーワードから応答生成を行う事例ベース自由対話系
江部 利明,乾 伸雄,小谷 善行(農工大)

入力文から「キーワード」と「働き」を求め、対話事例との
マッチングを行い、応答文の生成を行う自由対話システムの
設計・実現を行った。

(5) マルチメディア対話コーパス検索/再生ツールの作成
伊藤 一成,斎藤 博昭(慶大)

XQLによるGDAファイルの検索,動画コーパスの部分指定再生,構文情報の
表示等が可能なツールを開発した.

[13:00 ~ 14:30] ● Web構造解析       〔3件〕

(6) AreaView2001: KeyGraphを用いたWWW構造化システム
平 博司(東大),大澤 幸生(筑波大),伊庭 斉志,石塚 満(東大)

キーワード抽出法であるKeyGraphを用いた新しいWWW構造化システムについて
紹介する

(7) 参照共起分析のWebディレクトリへの適用
原田 昌紀,風間 一洋,佐藤 進也(NTT)

参照の共起性を利用した関連Webページ発見アルゴリズムを拡張し、Webディレ
クトリに適用したところ、高い精度で登録Webページ数を増大させることがで
きた。

(8) リンク構造の連結性に注目したコミュニティ導出に基づくWebブラウジング手法の提案
外山大介,吉高淳夫,平川正人(広島大)

Webサイト間のリンクによる連結の関係とそれによる影響性を重み付き偏差行
列で表現し、連結成分の抽出を行うことで共通の趣味、主張、興味を反映した
サイトの共同体を導出、提示し、ユーザのWebブラウジングを支援する。

[14:45 ~ 16:45] ● 語義・翻訳・要約      〔4件〕

(9) A Method for Similarity-based Lexical Disambiguation
Qujiang Peng, Haodong Wu, Teiji Furugori(電通大)

We present a method for word sense disambiguation based on a
statistical measure of word similarities with an experimental
result for 10 polysemous words with 670 instances.

(10) 多義動詞用例の分類結果に基づいた語義の規定手法
山口 昌也(国語研)

複数被験者の行う多義語の用例クラスタリング例に基づいて,語義を規定する
用例クラスタの獲得手法を提案する。

(11) 接頭・接尾辞を含む数量表現の翻訳方法
延原 由高,池原 悟,村上 仁一(鳥取大)

本研究では、接頭・接尾辞を含む数量表現の翻訳方法を対訳コーパスから
作成した基準値や、数詞の桁数の違いなどから考案し、その評価を報告する。

(12) 単語の中心性に基づくテキスト自動要約システム
石井 弘志,林 日華,古郡 廷治(電通大)

文の構文解析結果から単語の中心性を仮定し、それに基づき文の重要度を
計算することによってテキストを自動要約する手法を提案する。

[17:00 ~ 18:30] ● 構文解析・文脈解析     〔3件〕

(13) BNNを用いた日本語文の係り受け解析
長田 靖,吉田 敬一(静岡大)

ボルツマン・ニューラル・ネットワークとコーパスを用いることで人手の
かからない係り受け解析システムを提案する。

(14) チャンキングの段階適用による係り受け解析
工藤 拓, 松本 裕治(奈良先端大)

直後の文節に係るか係らないかという観点から2つの文節をまとめあげて行き,
それらをボトムアップに段階適用することで係り受け解析を行う.

(15) 日本語文章の文脈解析システムの開発研究
川端 崇央,原田 実(青山学院大)

文間の理由、条件、時間的近接などの意味的な関係を表す23個の文間深層格を
定義し、実際に日本語文章を処理し、文毎に文間深層格を記述したリストを
自動生成するシステムを開発した。

3月6日(火) ― 9:30 ~ 17:45 ―
[ 9:30 ~ 12:00] ● 情報抽出・テキストマイニング〔5件〕

(16) テキストコーパスにおける特徴語抽出のための分析ツール
相澤 彰子(情報学研)

形態素情報を手がかりに取出した複合名詞(候補)を分析し,異る観点に
基づく重要度ランキングを効率的に行うための数量尺度の定義およびデータ
表現・操作法について述べる.

(17) Support Vector Machines による日本語固有表現抽出
山田 寛康,工藤 拓,松本裕治(奈良先端大)

教師有り機械学習アルゴリズム Support Vector Machines を用いて日本語
固有表現抽出を行い、最適な素性について調査する。

(18) 同義テキストの照合に基づくパラフレーズに関する知識の自動獲得
村田 真樹,井佐原 均(通信総研)

パラフレーズに関する知識の自動獲得の研究を,辞書定義文,新聞記事
タイトル,講演テキストにおいて行なった.

(19) 株価データと新聞記事からのマイニング
小川 知也,渡部 勇(富士通研)

分類による新聞記事へのテーマ付与情報などに基づく株価変動の外部要因分析
に関し行った実験について報告を行う.

(20) 障害事例情報からのマイニング
斉藤 孝広,渡部 勇(富士通研)

テキストマイニング技術の適用事例として、自然文によって記述された
項目を含む障害事例情報からの知識の獲得方式について論ずる。
本方式は自由記述項目から概要情報を抽出し、各項目間の関連を可視化
する事で、有用な知識の提示を行うものである。

[13:00 ~ 15:30] ● Web情報管理       〔5件〕

(21) 目録データベースとWebコンテンツの統合的利用方式
杉田茂樹(北大),江口浩二(情報学研)

図書館の書誌・所蔵情報を扱う目録データベースと、WWW上に分散する非定型
な書評コンテンツの統合および連携を試みる。提案方式では、利用者が特定し
た図書やその関連図書に関する書誌・所蔵情報を目録検索システムに問合せ、
それを手がかりにWWW上で提供される当該図書に関する書評コンテンツを検索、
さらにその結果に自動編集を施し、利用者に提示する。本研究では、提案方式
をもとに試作システムを構築した。

(22) WWW空間上に存在する表構造の一索引化手法
岩口 義広,獅々堀 正幹,鄭 眠洙,青江 順一(徳島大)

HTML形式の表構造に対する索引化法を提案する.本手法により構築した索引は
コンパクトで,かつ,各項目間の高速な照合が可能である.

(23) WWWからの情報獲得・整理支援 – 思考・興味空間ブラウザ –
村上 晴美(大阪市立大),平田 高志(奈良先端大)

個人の外化記憶の構築を行い、知的生産活動を支援するシステムを試作した。
本稿では、WWWからの情報の切出し・整理機能, WWWブラウジング履歴からの
興味空間の自動生成機能を中心としてシステムの概要を述べる。

(24) 検索サービスデータベースによるWWWメタ検索サービスの高度化の研究
柏井優希,川越恭二(立命館大)

WWWコンテンツの増加に伴い情報検索サービスも増加し多様化している。このた
めユーザに取っては検索サービスの選択自体が困難な側面も出てきている.そこ
で本研究では検索サービスの選択を行なう従来とは異なったメタ検索サービスを
提案する。
ユーザにキーワード等の要素を入力してもらい,それを検索サービスデータベー
スと参照することによって最適な検索サービスを選択し,選択した検索サービス
に検索を依頼してその結果を表示するというシステムを紹介し、検索サービスの
選択方法を変えることによる評価比較も行なう。

(25) 協調的フィルタリングにおけるデフォルト投票値の効果的な設定方式
村松 茂樹,井ノ上 直己,帆足 啓一郎,橋本 和夫(KDD研)

協調的フィルタリングにおいてデフォルト値を用いた場合の評価の予測値の
変動を分析し効果的な設定方式について述べる.

[15:45 ~ 17:45] ● 対話型情報検索・HCI   〔4件〕

(26) 文献の適合度に関する目標値に基づくフィードバック手法
岸田和明(駿河台大)

適合性フィードバックをおこなう場合に、これまでの多くの手法は、各文献
が適合しているか否かの2値に基づいて、語の重み等の調整をおこなっている。
それに対して本研究は、検索質問に対する各文献の適合度を実数値として受け
取り、それを目標値として設定して、検索質問の語の重みを調整する方法を提
案し、NTCIRのコレクションを使ってその性能を実証的に確認する。

(27) 関係学習を用いたフィルタ生成による対話的Webページ検索
岡部正幸,山田誠二(東工大)

本研究では,ユーザに例題ページを示してもらうことにより,ユーザが必要と
するページのみを提示するためのフィルタを関係学習を用いて生成する検索
システムとその評価を行う.

(28) 利用者の分類例示に基づいて選出された特徴要素を用いた文書クラスタリング
則武 淳,吉高 淳夫,平川 正人(広島大)

例示されたクラスタの分離度が最大となる特徴要素集合を用いることで、
利用者の意図を反映したクラスタリングを目指す。

(29) 操作と状況の正・負の相関に基づいたユーザ操作の予測
安部信好,吉高淳夫,平川正人(広島大)

操作履歴と時間や場所などの状況を因子としたユーザ操作の予測手法を提案する.
ユーザが操作を行った時と行わなかった時の両方の状況に着目することで,
操作を行う要因と行わない要因を考慮した予測を行う.

プログラム先頭へ戻る.


照会先:松本 裕治, 宮田 高志 (奈良先端大)
作成日:平成12年12月29日