NTTデータベースシリーズ

「日本語の語彙特性」

新聞・テレビ・雑誌等で紹介された語彙数推定テストをお試しいただく場合は、 「語彙数推定テスト(wwwデモ版)」へどうぞ。 紹介されたものとは異なる単語を使ったテストもあります。ぜひお試し下さい。

*関連記事

  1. 朝日放送・きになるオセロ 2004年11月3日 23:17-
  2. テレビ朝日・やじ馬ワイド 2000年5月18日 6:58-
  3. 朝日新聞(夕刊) 2000年5月17日
  4. ISIZE あちゃら インターネット入門誌 2000年3月号 p.185.
  5. 読売テレビ・ニューススクランブル 「平成ことば事情」 2000年1月24日 18:23-
  6. 電子情報通信学会誌 1999年12月号 p.1280.
  7. フジテレビ・スーパーニュース 「大学生は”ボキャ貧” 学力調査第2弾」 1999年12月14日 17:25-
  8. 日経ネットナビ 2000年1月号 p.62.
  9. FLASH 1999年12月14日号 p.16-17. (1999年11月30日発売)
  10. 読売新聞: にほん語観察ノート(井上ひさし)1999年11月21日
  11. 朝日新聞(夕刊) 1999年11月6日
  12. 日本工業新聞 1999年10月27日
  13. 日経産業新聞 1999年9月30日


<概要>

NTTコミュニケーション科学基礎研究所では、これまで人間の言語機能の解明を目指した研究に取り組んできました。今回我々が構築した「日本語の語彙特性」は、言語に関わるあらゆる研究領域において、たいへん重要かつ不可欠なデータベースです。

本データベースには、単語親密度、単語表記の妥当性、単語アクセントの妥当性、単語心像性、漢字親密度、漢字複雑度、漢字の読みの妥当性など、人が主観的に評定を行ったデータと、14年間という長期にわたる新聞に単語や文字が出現した回数を数えた客観的データが収録されています。

これらのデータは、人間の言語処理過程に大きな影響を及ぼす特性として広く知られているものばかりです。したがって、本データベースに収録されているそれぞれの特性値や特性値間の関係は、日本語そのものの特性を示しているといえます。そして、本データベースの完成がもたらす最も重要な意味は、曖昧模糊とした言語という素材の特性を明確にすることにより、言語機能研究を科学的に遂行することが可能になることです。言いかえるならば, 本データベースは言語機能の解明を目指した科学的実験研究の基盤を提供するといってもよいでしょう。

<解説>

  1. データベース構築の経緯と目的

  2. データベースの概要

  3. データベースの有効性
  4. 応用例
  5. データベースの適用領域

<出版に関する情報>

第III期 第8巻(単語心像性)が2005年3月31日に刊行されました。
第 I  期 第1巻ー第6巻 CD−ROM版:       税抜価格 70,000円
第 II 期 第7巻         CD−ROM版:       税抜価格 20,000円
第 III期 第8巻         書籍+CD−ROM版: 税抜価格 60,000円


(過去の出版履歴)
第 I 期 全6巻9分冊(CD−ROM4枚付属):価格180,000円
1999年12月  第1刷刊行 完売
2000年 6月  第2刷刊行 完売
第 II 期 全2巻(CD−ROM1枚付属):価格50,000円
2000年3月  第1刷刊行 完売
注文、予約、および出版に関するお問い合わせは、
(株)三省堂 出版企画開発部 高野郁子
                 tel   03-3230-9443
                 fax   03-3230-9547
                 email tkn@sanseido-publ.co.jp

  • 三省堂ホームページ
  • 三省堂ホームページのNTTデータベースのページ


    関連リンク

  • 高速形態素解析システム「すもも」