形態素解析パッケージ ALTJAWS

-> English Version

機能概要

ALTJAWSは、NTTの日英機械翻訳実験システムALT-J/Eの形態素解析部分を切り出し パッケージ化したもので、 ワークステーション上で日本文の形態素解析をするプログラムです。 ALTJAWSは、入力された日本文を(1)単語毎に分割し、 (2)各単語の品詞と意味分類を決定し、(3)文節区切りを決定して出力します。 辞書や品詞体系等はALT-J/Eのものを用いており、 辞書語数が約35万語、品詞分類が約300分類、 意味分類が約3000分類になります。 また、利用者辞書の登録も可能です。

ALTJAWSは、各種日本語言語処理プログラムの前処理や、 日本語コーパスのタグ付けなどに利用されています。

パッケージ形態

ALTJAWSはUNIXのライブラリとして提供され、C言語のプログラムから 使用できます。 また、本ライブラリを用いたサンプルプログラムが付属しています。

サンプルプログラム動作例

日本文>>私は休暇を取る許可を取り、妻はホテルを取った。
-----
私は休暇を取る許可を取り、妻はホテルを取った。
1. 私(1710,[8,37])/は(7530)
2. 休暇(1100,[1932,1607])/を(7430)
3. 取る(2387)(2387,捕る)(2387,採る)(2387,盗る)
4. 許可(1220,[1166,1450,1735])/を(7430)
5. 取り(2383,取る)(2383,捕る)(2383,採る)(2383,盗る)/、([P]0210)
6. 妻(1100,[76,49,841])/は(7530)
7. ホテル(1100,[437,374])/を(7430)
8. 取っ(2384,取る)(2384,捕る)(2384,採る)(2384,盗る)/た(7216)/。([P]0110)
(注:括弧内の最初の4桁の数字は品詞コード、かぎ括弧内の数字は意味分類)

動作環境

備考

現在、システムを提供しておりません。


TANAKA Takaaki
Last modified: Fri Jun 7 19:19:32 JST 2002