NTT データベースシリーズ

「日本語の語彙特性」第III期の概要

<収録した特性値>

本データベース第III期には以下に示す主観的特性値が収録されています。

  1. 単語心像性(約4.5万単語)
  2. 多義語心像性(4千〜8千単語)

これらの特性値は、第I期 第1巻における 単語親密度4以上の単語を主な対象として, 文字呈示と音声呈示の両方で測定されています。


<特長>

本データベースは 東京都老人総合研究所 (佐久間尚子・伊集院睦雄・伏見貴夫・辰巳 格・田中正之) とNTTコミュニケーション科学基礎研究所(天野成昭・近藤公久)が共同して構 築した単語心像性データベースです。 その特長は, 対象とした単語数が極めて多いことです。 これまでの日本語における同種のデータベースに比べ10倍以上の規模です。 また単語が多義を持つ場合,それらを区別して単語心像性を収録した点も 特徴の一つです。 さらに文字呈示と音声呈示の両方の場合について 単語心像性を収録した点もこれまでに無い特長です。


<形態>

特性値は書籍に掲載するのみでなく、付属のCD−ROMにも収録しました。 各研究者が自由にデータを扱えるように全データを テキストファイル形式で提供しています。


<参考>

NTTデータベースに関する三省堂ホームページ