言語機能解明研究

<経緯と目的>

我々は通常数万から十数万の単語を使用して生活をして います。すなわち、このような膨大な数の単語を、読んだり、書いたり、聞い たり、話したりする機能が我々人間には備わっています。そして、そのような 機能は我々の脳に存在します。我々の脳は、どのような単語に対しても全く同 じ場所で同じ処理をしているとは限りません。たとえば、 ある単語は非常に速く理解できたり、逆にある単語は理解に時間がかかったりします。 このような違いは、それぞれの単語が持つ特性によって規定されます。 そしてそれぞれの単語が持つ特性は1つ1つ異なっています。

このように単語の特性が様々であるため, 人間の言語機能を研究するときには, 個々の単語が持つ特性をまず調べておく必要があります。 それはちょうど物理化学の研究をするときに, 個々の元素の特性をあらかじめ調べておく必要があるのと同じです。 物理化学では「周期表」という形で個々の元素の特性がまとめられています。 言語においてもこの「周期表」に相当するような単語の特性の 一覧表(データベース)が必要なのです。

ところが日本語に関しては, そのようなデータベースがこれまで存在しませんでした。 それは言語機能の研究を進める上で大きな障害となっていました。 例えば, 言語の基本単位である単語の特性がわからないため, それを組み合わせてできる 文章や会話の特性も正確には知ることができないという問題等がありました。

このような状況を打破し、 人間の言語機能の研究を合理的かつ能率的に進めることを目的として, 本データベースを構築しました。 これはある意味において人間の言語機能の研究の基盤を構築したことにも相当します。 このような研究基盤があれば, 言語機能の研究は飛躍的に発展するはずです。

<外部の状況>

言語機能の解明を目指した研究は古くから多くの研究者 によって行われてきました。しかし厳密な意味で単語の特性をきちんと統制 した研究は残念ながらあまり存在しません。

もちろんこれまでの研究者が、単語の特性を統制することの重要性を認識して いなかったわけでも無視してきたわけでもありません。彼らは研究に使用する 単語の特性を知るために、限られた既存の特性値データを参照したり、各研究 者が独自に調査した特性を使用したりしてきました。しかし既存の特性値デー タは単語数が少なかったり信頼性が低かったりする場合が多く、また独自に調 査した特性では他との共通性が低く研究間の相互比較が困難であったりすると いう問題がありました。

これまでの研究において 単語の特性が十分に統制されてこなかったのは、ひとえに研究に使用できる大 規模かつ高信頼度のデータベースが存在しなかったからです。