[Namazu-users-ja 536] Re: Namazu の検索 Hit 数に関して

biz biz952 @ yahoo.co.jp
2005年 10月 18日 (火) 12:51:34 JST


こんにちはbizです。
メーリングリストが届かず、今Namazu-users-ja Digest, Vol
17, Issue 1のみが届き、寺西様の返信を知りました。
重複した質問をしてしまい申し訳ございませんでした。
>寺西様
ご返答ありがとうございました。

今まで何度かIndex化しなおしても、ある単語において検索を
すると「ヒット数が多すぎるので無視しました」と出ていたの
ですが、indexのフォルダ内を一度すべて削除してからIndex化
したら検索ができるようになりました。
結局Indexが壊れていたのかもしれません...。
しかし、現象はこのサーバだけで発生したのではなく、筐体の
異なる同じバージョンのNamazuおよびそれに関連するモジュー
ルがインストールされているサーバー(ここではテスト機、本
番機)で同じ現象が出ています。
Indexが壊れたのだとすると、なぜ壊れたのか調査しないとま
た同じ現象が起きる可能性が高いのではないかと考えておりま
す。

そして、以下は寺西様のレスの返答です。
>・本当に 4,000 ファイルなのか?
>・NMZ.status の files の数はいくつなのか?
NMZ.status の files の数は以下です。
・files 4851
ちなみに 「keys」は 183094です。

・該当する単語の登録文書数はいくつなのか?
先ほど頂いたレスの添付ファイルというのは、http://www.namazu.org/pipermail/namazu-users-ja/attachments/20051018/02208624/nmzcount.pl.bin
から落とすnmzcount.pl.binのことでよろしかったでしょうか
?
おっしゃられた形式(gz)ではないのですが、拡張子を代えて
解凍するのでしょうか?それでよいのであればその方法を調べ
てみます。

・namazu で検索するとどうなるか?
以前、別の人間が試しましたところ、時間はかかりましたがHit
したようです。

また、検索したキーワードは「技術」や「基本」です。正規表
現は使っていませんし、NMZ.wにも2語とも登録されています。

これからIndexが壊れたと想定して、理由を調査しようと思い
ます。


--------------------------------------
Know more about Breast Cancer
http://pr.mail.yahoo.co.jp/pinkribbon/




Namazu-users-ja メーリングリストの案内