単語頻度と単語親密度

「日本語の語彙特性」第7巻 頻度データベースには、 各単語や文字の頻度データばかりでなく、分布や頻度の年間の比較や変化を始めと する頻度データの解析結果や、 客観的計数値である頻度と主観的評定値である親密度や表記のもっともらしさとの 関係についての解析結果についても示しています。 また、頻度が言語処理過程に及ぼす影響を確認する 目的で行った実験結果も掲載されています。ここでは解析結果の一部を紹介します。

<単語親密度と単語頻度の相関>

単語親密度(word familiarity)とは, ある単語がどの程度なじみがあると感じ られるかを表した指標であり、新聞等にその単語がどれだけ頻繁に出現するか を示す頻度との間には高い相関が見られます。

図6は、単語が新聞中に出現する頻度と単語親密度の関係 を示しています。単語頻度と単語親密度の相関係数は、.6 程度です。この図6 から、単語頻度が低くても単語親密度は高い単語が数多く存在するのに対し、 単語頻度が高い単語は必ず単語親密度も高いことがわかります。

図6 新聞中の単語頻度と単語親密度の相関


<単語音読潜時に対する単語頻度の効果>

図7は、漢字単語に対する音読課題(単語をなるべく早く 声に出して読む課題)における単語呈示から発声までの時間(音読潜時)の、 単語頻度ランク毎の平均を示しています。 単語頻度が高いほど音読潜時は短くなります。

図7 単語頻度と漢字単語に対する音読潜時の関係

頻度低:10未満、頻度中:10以上100未満、頻度高:1000以上