ALTJAWSは、NTTの日英機械翻訳実験システムALT-J/Eの形態素解析部分を切り出し パッケージ化したもので、 ワークステーション上で日本文の形態素解析をするプログラムです。 ALTJAWSは、入力された日本文を(1)単語毎に分割し、 (2)各単語の品詞と意味分類を決定し、(3)文節区切りを決定して出力します。 辞書や品詞体系等はALT-J/Eのものを用いており、 辞書語数が約35万語、品詞分類が約300分類、 意味分類が約3000分類になります。 また、利用者辞書の登録も可能です。
ALTJAWSは、各種日本語言語処理プログラムの前処理や、 日本語コーパスのタグ付けなどに利用されています。
ALTJAWSはUNIXのライブラリとして提供され、C言語のプログラムから 使用できます。 また、本ライブラリを用いたサンプルプログラムが付属しています。
日本文>>私は休暇を取る許可を取り、妻はホテルを取った。 ----- 私は休暇を取る許可を取り、妻はホテルを取った。 1. 私(1710,[8,37])/は(7530) 2. 休暇(1100,[1932,1607])/を(7430) 3. 取る(2387)(2387,捕る)(2387,採る)(2387,盗る) 4. 許可(1220,[1166,1450,1735])/を(7430) 5. 取り(2383,取る)(2383,捕る)(2383,採る)(2383,盗る)/、([P]0210) 6. 妻(1100,[76,49,841])/は(7530) 7. ホテル(1100,[437,374])/を(7430) 8. 取っ(2384,取る)(2384,捕る)(2384,採る)(2384,盗る)/た(7216)/。([P]0110)(注:括弧内の最初の4桁の数字は品詞コード、かぎ括弧内の数字は意味分類)
現在、システムを提供しておりません。