◇ 第144回 自然言語処理研究会

電子情報通信学会 言語理解とコミュニケーション研究会(NLC)と合同開催

◎日 程 平成13年7月16日(月) 9:30~17:30
17日(火) 9:00~17:30

◎会 場 公立はこだて未来大学 講堂(4階)
〒041-8655 北海道函館市亀田中野町116-2

〔交通手段〕
JR函館駅からタクシーなら約25分(4人乗りで約3000円)、バスなら約45分。函館空港からタクシーなら約30分
詳しくはこちらをどうぞ

〔連絡先〕大沢 英一(公立はこだて未来大学)
Tel: 0138-34-6127, Fax: 0138-34-6301

  • NLC側の開催案内はこちらです。研究会用の宿泊パック(JTB函館支店)に関する情報があります。締め切りました。
  • 講堂(階段教室): 定員300人.各席にLAN(要ケーブル), AC電源完備.
    プロジェクタ×2,大型スクリーン×2, 書画カメラ(OHC),スライド,VHS, 8mmVTR, miniDV, DV, LaserDisc, CD, MD.  <<注1>> OHP発表を予定の発表者は,透明なOHPシートではなく,紙に印刷した方がベター.
    <<注2>> 各席に LAN が来ていますが,LANコンセントとPCを接続するケーブルが必要です.
    また,LAN経由で外部にアクセスできるのは WWW だけです.セキュリティの関係で http 以外のパケットは通せません.
  • 専用バスのご案内
    大学へは路線バスの利用も可能ですが,研究会当日は混雑が予想されるため,研究会専用バスを用意致しました.
    研究会にご参加の皆様は,できるだけ専用バスを御利用下さいますようお願い致します.(料金は300円(路線バスは330円)に設定し,当日徴収致します)  <<専用バス発着場>> ハーバービューホテル前 (函館駅前ロータリーに面しています)
    <<バス会社>>    「北の星観光」バス (バス側面に文字,クリーム色,バスに「NL&NLC」という表示をしてあります)
    <<専用バス時刻表>>
    —————————————–
    7/16 往:函館駅 8:00発 ~未来大 8:40着
    (月) 復:未来大 18:30発 ~函館駅 19:00着
    —————————————–
    7/17 往:函館駅 8:00発 ~未来大 8:40着
    (火) 復:設定なし
    —————————————–

【プログラム】(発表件数29件)


7月16日(月) ― 9:30 ~ 17:30 ―

[ 9:30 ~ 11:30] ● 機械翻訳         〔4件〕

1. 対訳文書から自動抽出した用語対訳による機械翻訳の訳語精度向上
○出羽 達也((株)東芝 研究開発センター 知識メディアラボラトリー)

対訳文書から自動抽出した用語対訳の直接利用による訳語精度向上効果を
特許抄録の日英機械翻訳で評価した。

2. 局所部分の着目により再帰的に翻訳ルールを獲得する学習型機械翻訳手法GA-ILMT2
○越前谷 博(北海学園大)、荒木 健治(北大)、桃内 佳雄(北海学園大)、
栃内 香次(北大)

類似度が低い翻訳ルールの集合から効率良く、かつ再帰的に翻訳ルールを
獲得することが可能な学習型機械翻訳手法GA-ILMT2について報告する。

3. 日中機械翻訳プロトタイプ
○山田 節夫、林 実、片岡 明、横尾 昭男、大山 芳史
(NTTコミュニケーション科学基礎研究所)

中国語と日本語を同時に扱えるunicodeに対応させた日中機械翻訳
システムのプロトタイプについて述べる。

4. 用例ベース翻訳のためのパラレルコーパスからの対訳対発見
○荒牧 英治、黒橋 禎夫、佐藤 理史(京都大学)、渡辺 日出雄(日本IBM)

文同士の対応がとられた日本語と英語の対訳文を入力とし、句レベルで
対訳対を発見する手法とシステムについて述べる。

[12:45 ~ 14:45] ● 語彙           〔4件〕

5. 正誤判別規則学習を用いた複数の日本語固有表現抽出システムの出力の混合
○宇津呂 武仁(豊橋技術科学大学)、颯々野 学(富士通研究所)、
内元 清貴(独立行政法人 通信総合研究所)

stackingの手法により,複数の日本語固有表現抽出システムの出力の正誤を
判別する規則を学習することにより,システムの混合を行う.

6. Automatic disabbreviation using context information
○寺田 昭、徳永 健伸(東工大)

文脈情報を用いて、略語を元の語に復元する手法を提案する。航空関係の
データを使用して評価実験を行なった。

7. タグなしコーパスによる形態素解析と仮名漢字変換の精度向上
○森 信介、伊東 伸泰(日本IBM)

生コーパスの自動形態素解析結果を学習コーパスに追加することに
よる確率的形態素解析と確率的仮名漢字変換の精度変化を比較する。

8. 統計的モデルを用いた単語クラスタリング
○川前 徳章、青木 輝勝、安田 浩(東京大学先端科学技術研究センター)

ある特定のテーマに記述された文書に出現する単語には、何らかの意味的な
関係があると考えられる。また同じテーマに関しての文書でも著者により
用いる単語が異なる場合がある。本研究では、文書の分類の為に、特定の
テーマに関しての単語の関係を確率的モデルを用いて抽出する手法を提案する。

[15:00 ~ 17:30] ● 情報検索・語義曖昧性解消 〔5件〕

9. Simple PCA を用いたベクトル空間情報検索モデルの次元削減
○黒岩 眞吾、柘植 覚、田仁 宏典、Tai Xiaoying、獅々堀 正幹、北 研二
(徳島大学 工学部 知能情報工学科)

ベクトル空間モデルを用いた情報検索手法に、Simple PCA を適用し、
MEDLINEでその有効性を確認した。

10. 学習分野の共起語情報を用いた学習情報の検索手法の検討
○鈴木 雅実(通信・放送機構)、
松本 一則・井ノ上 直己・橋本 和夫(KDDI研究所)、
  中山 実(東京工業大学)、清水 康敬(国立教育政策研究所)

学習分野毎に抽出した語の共起情報を用いて,検索語を追加することにより
検索精度を向上させる手法について,実験結果を報告する。

11. インターネットからの評判情報検索
〇立石 健二、石黒 義英、福島 俊一(NECインターネットシステム研究所)

インターネットから任意の商品に関する評判(例.「モバイルギアは
良い」)を自動検索するシステムを開発した。

12. 素性空間再構成によるWord-Sense Disambiguation
○高村大也、山田寛康、工藤拓、山本薫、松本裕治(奈良先端大)

独立成分分析などの手法により事例の性質を考慮することにより、語義の曖昧性
解消の性能を向上させる。

13. ベイズ推定による決定リストのルール信頼度推定法
○鶴岡 慶雅(東京大学工学系研究科)、
近山 隆(東京大学新領域創成科学研究科)

事前情報を利用したベイズ推定によりルールの信頼度を正確に推定し、
語義曖昧性解消の実験でその有効性を示す。

7月17日(火) ― 9:00 ~ 17:30 ―

[9:00 ~ 10:30] ● 構文解析         〔3件〕

14. 品詞列に基づく構文解析
○乾 伸雄、小谷 善行(東京農工大)

タグ付き・括弧付きコーパスから得られた品詞Nグラム情報を用いて自然
言語文を構文解析する.

15. 頻度に基づく正の例からの負の例の予測
— 日本語表記の誤り検出と外の関係の文の自動抽出 —
○村田 真樹、井佐原 均(通信総研)

頻度に基づく正の例からの負の例の予測方法を述べ,その具体的応用として
簡易スペルチェッカと外の関係の文の自動抽出を示す.

16. 機械学習手法を用いた日本語格解析
–教師信号借用型と非借用型,さらには併用型–
○村田 真樹(通信総研)

省略解析の一般解法の再提示と整理,および,機械学習手法による
日本語格解析の小規模な実験結果を示す.

[10:45 ~ 12:15] ● 応用           〔3件〕

17. 聴覚障害者向け字幕番組の制作技術
○江原 暉将(NHK/TAO)、澤村 英治(TAO)、
福島 孝博(TAO/追手門学院大)、丸山 一郎(三菱電機)、
和田 裕二(TAO)、門馬 隆雄(TAO)、白井 克彦(TAO/早大)

TAOの字幕制作技術研究プロジェクトにおける、
自動要約、自動同期、自動字幕画面制作、システム統合の各テーマの
研究経過、成果、課題を報告する。

18. diff と言語処理
○村田 真樹、井佐原 均(通信総研)

diff の言語処理の応用先として,データのマージ,差分検出,
書き換え規則の獲得,最適照合の例を示す.

19. RDB を利用したタグ付きコーパス検索支援環境の構築
○工藤 拓、松本 裕治(奈良先端大)

リレーショナルデータベースを用い, 品詞や構文情報が付与されたコーパスの
中から, 任意の単語の連接や部分木などを柔軟かつ簡単に検索するシステムを
構築した.

[13:15 ~ 15:15] ● 要約・言いかえ・情報提示 〔4件〕

20. 第2回 NTCIR ワークショップ 自動要約タスク(TSC)の結果および評価法の分析
○難波 英嗣(日本学術振興会 特別研究員), 奥村 学(東工大)

本研究では, 2001年3月まで行なわれた第2回NTCIRワークショップ
サブタスクTSCの分析を行ない, その結果を報告する.

21. n-gram交代数を用いた半構造化データの不要部分削除
○山田 泰寛(九州大学システム情報科学府)、
池田 大輔(九州大学情報基盤センター)、
廣川 佐千男(九州大学情報基盤センター)

新しく導入したn-gram交代数を用いて,入力から一切の背景知識を用いずに,
必要部分を残すことに成功した.

22. ユーザの視点を考慮に入れた社会情報可視化システムの構築
岩本 雅道(国際協力事業団)、○石崎 雅人、國藤 進(北陸先端大)

新聞などの社会情報を対象として,ユーザの視点から情報をまとめ,時間に
沿った情報の推移を表示を可能にした情報可視化システムを構築したので,
それについて報告する.

23. 国語辞典に基づく平易文へのパラフレーズ
○鍜治 伸裕(京都大学)、黒橋 禎夫(東京大学)、佐藤 理史(京都大学)

言語の意味を言語で説明するという観点に立って、文を
平易文へとパラフレーズする手法について述べる

[15:30 ~ 17:30] ● 意味解析・対話処理    〔4件〕

24. 帰納的学習を用いた括弧付きコーパスからの意味解析規則の自動獲得手法の性能評価
○渋木 英潔、荒木 健治、栃内 香次(北海道大)

意味解析に必要な規則を教師なしで獲得する手法を提案し、提案手法を
実装したシステムの評価をする。

25. 他動・再帰・使役
加藤 弘(東北大学留学生センター)

2001.3の研究の延長として、次のような主張等を行う。
1)一般に他動詞だと考えられている「済ますetc.」は、使役構造
「済ませるetc.」の縮約形である。2)同じく他動詞と考えられて
いる「立てるetc,」には、同形の他動詞と使役構造「立たせるetc.」
の縮約形とが並存し、再帰他動的用法を持っている。
参考:情報処理学会第7回年次大会発表論文集 351-354

26. 対話コスト最小化に基づく効率的対話制御
○堂坂 浩二、安田 宜仁、相川 清明(NTTコミュニケーション科学基礎研究所)

音声対話システムが手持ちの知識の範囲内で効率的に対話を
実施する方法と,評価結果を示す.

27. 音声対話における実例に基づく未知語属性推定
○高橋 康博、堂坂 浩二、相川 清明(NTTコミュニケーション科学基礎研究所)

音声対話システムがユーザ発話中の未知語の属性を推定
する方法を提案し,その実験結果を報告する.

プログラムの先頭へ戻る。


照会先:松本 裕治, 宮田 高志 (奈良先端大)
作成日:平成13年5月10日