Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

要望検索時のかなの分かち書き処理の切り替え



 濱谷@リコーシステム開発です。
 Namazu 2.0.9 (tar.gz版) + Chasen 2.2.8 (tar.gz版) を
RedHat Linux 7.1 で使用しています。

 namazu.cgi が検索時に行う分かち書き処理は漢字とひらがな・カタカナで
異なりますが、ひらがな・カタカナの処理を漢字と同じにするオプションが
あれば便利だと思いました。

 インデックス作成時の分かち書きに kakasi を使っている場合は、
ひらがな・カタカナの語は分かち書きされませんが、chasenの場合は、
辞書に該当の語があれば分かち書きされます。
 そこで、chasenを使った場合は、namazu.cgi でも漢字と
同じ処理をしたほうが便利だと思います。
 (実際に手元で試してみました。メーリングリストの
http://www.namazu.org/ml/namazu-users-ja/msg01199.html
と同じ変更を行って、希望の動作を得られました。)

 そこで、.namazurc にて、ひらがな・カタカナの処理を漢字と同じにする
オプションがあれば便利だと思います。
たとえば wakati_kana on で従来の動作に、wakati_kana(LOGGINGオプションとほぼ同じ
処理になりますね)

以上、ご検討いただけるとうれしいです。

--
 リコーシステム開発(株)  濱谷 千尋 (Hamatani, Chihiro)
 mailto:hamatani@xxxxxxxxxxxxxxx