namazu-dev(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

CMU-Cambridge Statistical Language Toolkit



明けましておめでとうございます。
小松と申します。

 例によって、あさっての方のお話ですが、namazu に無理矢理
単語の位置情報を持たせようともがいているうちに、年が明けて
しまいました。(^^;; ふと気がつけば、もう 3 日...

 ちょっと無理な改造のようなので、方針を変えて、N-gram 辞書
を持たせようということで、探してみると音声認識用の言語モデル
作成ツールキットというのが転用できるようです。

# ラッキ〜

 ご参考までに紹介しておきます。

http://svr-www.eng.cam.ac.uk/~prc14/toolkit.html

 デフォルトがビッグエンディアンなので、Linux では src/Makefile
の #BYTESWAP_FLAG  = -DSLM_SWAP_BYTES の行のコメントマークをはず
してから、src/のディレクトリで make install 一発。

 メモリを鯨飲馬食しますが、chasen や kakasi と組み合わせれば
日本語にも使えるようです。

#フレーズ検索の強化に使えるかもしれませんし、音声認識
#対応 namazu もできるかもしれません(初夢モード)