Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

kakasi辞書メンテについて



こんにちは。mizusakoです。

 現在、Namazuの全文検索対象として専門文書を扱っているため、
文中に「カタカナ(全角)」や「英単語(全角)」が多く含まれています。

 検索する側としては、当然このような単語をキーワードに検索することが
多いので、検索のヒット率を上げるために、標準の辞書をメンテすることを
検討しています。

 まず、漢字の単語を登録する際は、
「読み 漢字」で構成された「localdict」ファイルを用意し、
 # mkkanwa kanwadict kakasidict localdict

以上のコマンドで作成できると分かったのですが、
「mkkanwa」の仕様として、漢字の部分は、必ず1文字目が漢字でないと
登録してくれないですよね。

辞書の単語として、「カタカナ」や「英単語」などを登録する場合は、
どのように行えばよろしいのでしょうか?

_/_/_/_/_/_/_/_/_/_/_/_/_/
Mizusako
mizusako@xxxxxxxxxxxxxxx
_/_/_/_/_/_/_/_/_/_/_/_/_/_