プログラム / 講演・テーマ展示一覧 /
テーマ展示

概要
現在の自然言語処理は,膨大なデータから瞬時に検索が行えるまでに発達しています.しかし,そこでの処理は表面的な情報しか扱っておらず,文章の意味のレベルまで処理できているとは言えません.本テーマ展示では,統計的アプローチなどを武器にした「ちゃんと読解できるコンピュータ」の要素となる研究内容を展示いたします.
本テーマ展示では, という3項目について,ご紹介します.
本テーマ展示では, という3項目について,ご紹介します.
展示紹介ムービー
個別展示
言葉の意味を読み取る -述語項構造解析-
どんな研究?
現在のコンピュータシステムでは,人が書いた普通の文章から,文全体としての意味を読み取ることが苦手です.このような文章から,本質的に「何がどうした」のかを読み取れるように文章全体を意味レベルで解析します.
どこが凄い?
統計的手法を用いて,日本語大規模データから解析ルールを取り出すことに成功しました.解析ルールに人間が理解しやすい形式を用いることにより,解析精度を保ちつつ,人手によるメンテナンスが容易になった世界で初めての方法です.
もたらされる変革
大量のテキスト情報から意味的に同じ文章を簡単に集約できるようになります.その結果,特定の商品やサービスについて,ネット上に書かれた文章や自由記述のアンケートから,正確に評判を分析するといったシステムの構築が可能になります.
関連文献
- H. Taira, S. Fujita, M. Nagata, “A Japanese Predicate Argument Structure Analysis using Decision Lists,” Proc. of EMNLP-08, pp. 522-531, 2008. [ PDF ]
- 平, 藤田, 永田, “決定リストを用いた述語項構造解析,”言語処理学会第15回年次大会予稿集, pp. 368-371, 2009.
個別展示紹介ムービー
「なぜ」に答える質問応答システム NAZEQA -原因表現の自動獲得と機械学習に基づく理由検索-
どんな研究?
ユーザの「なぜ?」という理由を尋ねる質問に対してずばり回答を出すシステムの研究です.昨年のシステムから大幅に精度を改善し,新聞記事からだけではなく,ウェブ上の文書からも検索できるようにしました.
どこが凄い?
自動獲得された多様な原因表現と機械学習の手法を組み合わせることで,「ため」「ので」などの理由や原因を表す表現を含まない文からでも,高精度に適切な理由を探しだすことができます.
もたらされる変革
答えをずばり検索できるため,欲しい情報をすぐに届けるようなサービスの実現につながります.また,検索ポータル,社内のトラブルシューティング,ロボットの知識源の自動獲得などに応用できます.
関連文献
- R. Higashinaka, H. Isozaki, “Automatically Acquiring Causal Expression Patterns from Relation-annotated Corpora to Improve Question Answering for why-Questions”, ACM Trans. on Asian Language Information Processing, Special Issue on NTCIR-6, Volume 7, Issue 2, Article 6 (29 pages), 2008. [ Webpage ]
個別展示紹介ムービー
最新の医療を知る手助けをします -統計的自然言語処理に基づく医療情報読解支援システム-
どんな研究?
生物医学分野の論文抄録のように有益な英語の情報がインターネット上に溢れています.しかし,一般の人がそれを理解することは困難です.そこで,母国語で理解できるように,読者を支援するシステムを最新の統計的言語処理技術で実現します.
どこが凄い?
英語文書の翻訳,文の意味役割付与,用語抽出を行うシステムを少数の正解事例から自動的に実現できます.正解が判らない文書であっても大量に学習に用いることで,それらの文書に適したシステムを構築できます.
もたらされる変革
将来,専門家でない一般の人でも最新の医療情報にアクセスできるようになります.その結果,新たな治療法,新薬の情報など,人々の健康に関わる重要な情報を知ることが可能になります.
関連文献
- Jun Suzuki and Hideki Isozaki: Semi-supervised Sequential Labeling and Segmentation using Giga-word Scale Unlabeled Data, Proc. of ACL-2008 [ PDF ]
- Jun Suzuki, Akinori Fujino, Hideki Isozaki: Semi-Supervised Structured Output Learning based on a Hybrid Generative and Discriminative Approach, Proc. of EMNLP-CoNLL-2007 [ PDF ]
- 塚田 元,渡辺 太郎,鈴木 潤,永田 昌明,磯崎 秀樹: 統計的機械翻訳, NTT技術ジャーナル, 2007 [ PDF ]
- T. Watanabe, H. Tsukada, and H. Isozaki: Left-to-Right Target Generation for Hierarchical Phrase-Based Translation, COLING-ACL, 2006. [ PDF ]
- T. Watanabe, J. Suzuki, H. Tsukada, and H. Isozaki: Online Large-Margin Training for Statistical Machine Translation, EMNLP-CoNLL, 2007. [ PDF ]
個別展示紹介ムービー
関連ムービー
