◎日 程 平成11年11月25日(木) 10:00 ~ 16:50
26日(金) 9:15 ~ 15:30
◎会 場 北海道大学百年記念会館 会議室
(〒660 札幌市 北区 北8条西6丁目)
〔交通手段〕
- 空路 新千歳空港 →(JR快速エアポート)→ 札幌 (約 1 時間)
- JR札幌駅北口徒歩6分
- 北海道大学百年記念会館の交通案内・地図のページ: http://www.hokudai.ac.jp/bureau/keiri/sisetu/p.html
〔連絡先〕
- 荒木 健治 (北海道大学 大学院 工学研究科 電子情報工学専攻)
〒060-8628 札幌市北区北13条西8丁目
TEL: 011-706-6534
FAX: 011-709-6277
◎ 懇親会
〔会場〕魚八一丁 札幌駅前店
(北6条西1丁目、研究会会場から徒歩10分程度)
電話 011-232-0022
〔時間〕17:30 ~ 19:30
〔会費〕一般: 5000円、学生: 3000円
【プログラム】
(発表件数21件)
- 11月25日(木) ― 10:00 ~ 16:50 ―
- 11月26日(金) ― 9:15 ~ 15:30 ―
11月25日(木) ― 10:00 ~ 16:50 ―
[10:00 ~ 12:00] ●コーパス作成・修正 〔4件〕
(1) 中日対訳コーパスの問題点とその試用例
○曹 大峰(国立国語研究所・中国山東大学), 中野 洋(国立国語研究所),
徐 一平(北京日本学研究センター), 隈井 裕之(日立製作所中央研究所)
1300万字の規模を持つ「中日対訳コーパス(基礎版)」の開発概要と
利用計画を紹介し、そのアラインメント・情報付与などの問題点や対
照研究への試用例を報告する。
(2) 口語体言語モデルのためのコーパス
○伊東伸泰, 西村雅史(日本IBM 東京基礎研究所)
放送大学の授業を書き起こしたコーパスの作成と、その統計的
性質について報告する。
(3) 統計的部分係り受け解析における係り受け確率の利用法
◯乾 孝司, 乾 健太郎(九州工業大学)
統計的部分係り受け解析における係り受け確率は,言語モデルの問題
点の検出やコーパスの誤り検出に利用できると考えられる.これを検
証する実験を行ったので,その結果を報告する.
(4) 形態素再解析を用いたコーパスの品詞体系変換
○松田 寛, 桐山 和久,山田 悟史, 吉野 圭一, 松本 裕治(奈良先端大)
形態素解析システムの辞書エントリに機能語シンボルを加えることで
高精度な品詞体系変換を可能にする
(5) n-gram分布を用いた近代日本語小説文の著者推定
○松浦 司(東大理学系研究科), 金田 康正(東大情報基盤センター)
n-gram分布状況から文章の著者を推定する手法を提案し、
近代日本語小説文を対象とした実験結果について報告する。
(6) 情報検索タスクに基づく句表現要約の評価
○岡 満美子, 上田 良寛(富士ゼロックス 総合研究所)
要約のタスクベース評価方法として、より正確な評価を行う方法を提
案し、これを用いた句表現要約の評価結果を報告する。
(7) Document Clustering: Before and After Singular Value Decomposition
○Md Maruf HASAN, Yuji MATSUMOTO
(Nara Institute of Science and Technology)
We addressed clustering of a Document Collection by using their
Term-Document-Matrix. Clustering algorithm is applied before
and after Singular Value Decomposition of the Term-Document-Matrix.
(8) The parameter-based analysis of Japanese relative clauses
○Timothy Baldwin, Takenobu Tokunaga, and Hozumi Tanaka
(Tokyo Institute of Technology)
Given an array of parameters considered to affect Japanese
relative clause interpretation, we apply conventional decision
tree-based methods to their analysis, returning the semantic
type of relative clause modification. Through modifying the
range of parameters considered, we evaluate the effectivity of
the various parameters in relative clause interpretation.
(9) ランベック計算を用いた量化子作用域と多義性の研究
小林 昌博(東北大学 国際文化研究科)
英語の構文における,量化子の作用域とそれによる多義性に関する
諸問題を処理する枠組みを提案する.
(10)枝分かれするネットワークを用いた格構造解析システムへの
頻度情報の導入とその評価
◯竹内 俊行, 荒木 健治, 栃内 香次(北大工)
既定案システムに格構造の使用頻度情報を導入し、実験・考察を行な
い、これまでのシステムと解析率等を比較する。
(11)人間の照応解決過程の計算モデル
-“即時性”の仮説の妥当性を中心に-
○中島 輝明(北大大学院文学研究科), 阿部 純一(北大文学部)
文処理のいつの時点で,どの程度代名詞が解釈されているのか,とい
う問題に対して,認知心理学的観点からモデルを提案する。
11月26日(金) ― 9:15 ~ 15:30 ―
(12)新聞記事からの用語集作成のためのテキスト分析
○木田 敦子(計量計画研究所), 乾 裕子(計量計画研究所/九州工業大学),
落谷 亮, 西野 文人(富士通研究所)
事象および事物を定義する表現の抽出により、百科辞典的知識データ
ベースの自動作成を行う研究を進めている。本件では定義表現の自動
抽出規則作成のために行ったテキストの分析結果について報告する。
(13)類似例の存在を否定的な要因として用いる重要バイグラムの収集支援方法
○丹羽 芳樹, 久光 徹, 今一 修(日立製作所)
単語バイグラムが類似例を持つかどうかで複合語としてのユニークさ
をはかり、検索ガイダンスに適した重要複合語の収集作業を支援する。
(14)入力質問文と知識表現との柔軟なマッチングによる対話的ヘルプシステム
○日笠 亘, 藤井 綱貴, 黒橋 禎夫(京都大学情報学研究科)
京都大学の計算機教育環境におけるアプリケーション等の初歩的な質
問を受け付ける対話的ヘルプシステムを構築した。
(15)文脈自由文法を用いた日本語誤り検出・訂正手法の提案
◯渥美 清隆(静岡大学工学部)
文脈自由文法を用いた1文字単位の誤り検出・訂正法の提案と、
tri-gramにおける誤り検出・訂正との再現率、適合率の比較を
行った結果を発表する。
(16)漸進的構文解析における構文的曖昧性とその解消
○加藤 芳秀, 松原 茂樹, 外山 勝彦, 稲垣 康善(名古屋大学)
漸進的チャート解析において作成された構文構造の中から,以後の入
力に対して解析を続行できる構造を随時判別する手法を提案する.
(17)中国語未登録名詞の自動認識
○韓 東力, 古郡 廷治(電気通信大学 情報工学科)
中国語自然言語処理における単語分割の精度を上げるための
未登録名詞の自動認識に関する研究。
(18)母語話者の類似度評価に基づいた助詞「に」の意味構造の計量的分析
茂木 亮輔(東北大学 国際文化研究科)
助詞「に」の意味構造を類似度調査から計量的に分析し、
多様な用法が持つ認知的繋がりの一端を示した。
(19)Preliminary analysis of the range and frequency of
Japanese verb alternations
○Timothy Baldwin, Takenobu Tokunaga, and Hozumi Tanaka
(Tokyo Institute of Technology)
We set out to empirically identify the range and frequency of
basic verb alternation types in Japanese, through analysis of
the Goi-Taikei Japanese valency dictionary. This is achieved
through comparison of the selectional preference case marker
annotation on corresponding case slots. The set of alternation
types is applied in such tasks as analysing inter-verbal
lexical and semantic correspondences.
(20)帰納的学習を用いた訳語推定手法における解析的知識の有効性について
○笹岡久行, 荒木健治, 桃内佳雄, 栃内香次(北海道大学工学部)
既に我々が提案した手法では字面情報を基に訳語推定に用いる単位で
ある単語片対を獲得したが、単語片対の過分割等があり、十分な量の
有効な単語片対の獲得が実現できていない。そこで、学習処理におけ
る形態素情報の利用の有効性について考察する。
(21)連想としての意味
○持橋 大地, 松本 裕治(奈良先端大)
単語の意味を単語間の連想関係を表す確率ベクトルとして表現し,
Bayesian Belief としての連想確率のコーパスからの獲得とMarkov
ネットワーク上の活性伝播による意味の計算について述べる。
照会先: 松本 裕治 , 宇津呂 武仁 (奈良先端大)
作成日:平成11年9月6日