Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: 数字混じりの単語の検索ができますか?



寺西です。

Natsuko Yoshiga wrote:
> 
> namazuを私の管理しているサーバに導入して、利用者に時々使い勝手を
> 聞いているのですが、「IPv6、POP3といった数字混じりの単語を検索す
> ると、英文のドキュメントしかヒットしないのは何故か」とよく質問さ
> れまず。
> 
> 確かに「IPv 6」「POP 3」「IPv*」「POP*」とすれば日本語のドキュメ
> ントをヒットできるのですが、「IPv6」などと連続すると英文のみ検索
> してしまいます。まったくヒットしないというわけではなく、英文であ
> ればヒットするというところが不思議です。

英文であればヒットするということから、mknmz の日本語処理において
問題が生じているのでしょう。
また、手元の kakasi を使った環境では再現していないので、おそらく
茶筅の問題ではないかと思います。

> chasenにユーザ辞書を登録したり、chasenrcの設定をしてみましたが思
> ったようにヒットしません。
> NMZ.wには例えばIP、IPv、6、IPv6のいずれも登録されていました。

「IPv6」の含まれているもので、検索でヒットしない日本語のドキュメント
1つのみを、mknmz を実行した場合にはどうなるでしょうか?

おそらくは、NMZ.w に IPv6 は含まれないと思います。
ここで、IPv6 が含まれているのに、namazu で検索できないということ
でしたら、namazu 側の問題になります。

> 何かよい対処法がありましたら教えてください。IPv6と素直に入力して
> 全ての文章がヒットすればいいのですが。

kakasi を使うという手もあるかと。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E