研究展示

コミュニケーションと計算の科学

10

文や段落の修飾関係を賢く判断

ニューラルネットによる階層的トップダウン修辞構造解析

どんな研究

文書の背後にある談話構造を木として表現する研究を紹介します。文書を段落系列と文系列で構成された入れ子の階層構造としてとらえ、それぞれの階層での修辞構造をニューラルネットを用いて推定します。そして、それらをつなぎ合わせることで文書全体をあらわす修辞構造木を構築します。

どこが凄い

段落、文系列を独立かつ再帰的に二分割することで木を構築するため、並列化が容易であり長い文書であっても高速に動作することが期待できます。ニューラルネットを用いてテキストデータを自動的に特徴ベクトルに変換するため、人手で複雑な特徴を考える必要がありません。

めざす未来

自然言語処理技術は「文」だけではなく「文章」も処理対象として扱う必要があります。例えば、文書を翻訳する際には文脈に応じて適切な訳語を選ぶ、要約する場合には原文書の話題の一貫性を損なわぬようにすることが重要です。本研究はこうした自然言語処理の基盤として必要不可欠です。

関連文献

  • [1] 小林尚輝, 平尾努, 奥村学, 永田昌明, “階層構造を考慮したトップダウン談話構造解析,” 言語処理学会第25回年次大会, pp. 1002-1005, 2019.

ポスター

アイコンをクリックすると、展示ポスターのPDFが開きます。
PDFの表示にはAdobe Acrobat Reader等のPDF閲覧表示が必要です。

当日の様子

連絡先

平尾 努(Tsutomu Hirao) 協創情報研究部 言語知能研究グループ
Email: