研究講演

言葉の難しさを測る

~テキストの難易度と人の語彙数の推定~

協創情報研究部
藤田 早苗

概要

文章を読むときに、難しいと感じるか、易しいと感じるかは、文章の難易度と読み手自身の知識量の両方に依存します。文章(テキスト)の難しさを自動的に推定するための難易度推定と、読み手側の知識量(語彙数)の推定が、簡単に、高精度にできれば、適した難しさのテキストを推薦することができ、学習支援につなげることも可能です。
講演では、我々が取り組んでいる両方の推定方法をご紹介します。 テキストの難易度推定方法は、幼児向けのテキストから大人向けのテキストまで、幅広いテキストの難易度を推定できるロバストで汎用性の高い手法です。また、語彙数推定方法は、大人はもちろん、小学生から高校生といった学習過程にある子どもにも適用可能です。現在、これらを組み合わせた教育支援への取り組みを始めています。

講演動画

講演動画はPart1,Part2,Part3の3つのパート分かれています。ぜひ、全編を通してごらんください。

Part1: 人の語彙数推定方法と大規模調査 ~語彙数を測る~ (8分58秒)

Part2: 令和版単語親密データベース ~語のなじみ深さを測る~ (6分31秒)

Part3: 絵本データベースの構築と難易度推定 ~テキストの難しさを測る~ (11分22秒)

関連コンテンツ

講演資料

講演者紹介

協創情報研究部
藤田 早苗
NTT コミュニケーション科学基礎研究所 協創情報研究部 主任研究員。1999年奈良先端科学技術大学院大学 情報科学研究科 修士課程修了。同年、NTTに入社。博士(工学)。自然言語処理研究に従事。言語処理学会、情報処理学会各会員。3人の子どもの成長とともに、絵本の難易度推定、学齢期の語彙数調査、英語学習支援と研究テーマを広げています。