Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

混ぜ書きの言葉と文節



ふくしです。
kakasi を漢字かな逆変換の用途で使っています。

kakasi は、漢字/カタカナ/ひらがなの混ぜ書きの言葉に出会うと、
まず文字種による分かちを行なってから逆変換を行ないますね。
ゆえに、

 ごみばこ ごみ箱
 びーぷおん ビープ音

などのエントリを kakasidict に登録しても無効になります。
(ごみはこ、びーぷおと、となります)

これは仕様上しょうがないのでしょうか?
本来の namazu の用途では、混ぜ書きの単語が形態素として
分かたれなくても不具合はありませんか?