[Namazu-users-ja 531] Namazu の検索 Hit 数に関して

biz biz952 @ yahoo.co.jp
2005年 10月 17日 (月) 23:10:16 JST


こんばんはbizです。
当方namazu.cgiを使い検索システムを構築しました。
---問題の現象は以下です。
検索したキーワードのHit数が多すぎてこのメッセージが出て
いることだと思いますが、ある単語で検索すると「ヒット数が
多すぎるので無視しました」というメッセージがでます。

---前提条件
1.mknmz時に-M(メタタグをフィールド指定検索に用いる)
をつけています。
2..namazurcにあるMaxHitはデフォルトの10000のままです。
3.この状況でMaxHitを25000以上に増やすと検索結果が1分返
答が帰ってこなく、タイムアウトになります。(おそらくサー
バのスペックに依存するものかと思いますが...。私のサー
バの環境では25000以下ですと1秒以内に検索結果が返ってきま
す。)

---前置きが長くなりましたが、お聞きしたい点は以下です。
・皆さんはMaxHitの設定をどのくらいにしていますでしょうか
?
(25000程度で検索できなくなるものなのでしょうか?)
・現在index化しているページ数は4000程度ですが、MaxHit(
ヒットする文書数)が10000を超えているのに、Hit数がそれ以
上になるのはなぜでしょうか?(もしかして1ページ内にある
検索ワードの数をカウントしているのでしょうか?)
・Hit数が多く、検索結果が出てこない現象に関して上記に記
した前提条件を変えずに検索結果を出す方法はありますでしょ
うか?
(「1ページ内にある検索ワードの数をカウントしている」と
いう仮説が正しければ、1ページ内に1語検索ワードがあった
らそのページ内はそれ以降検索ワードをカウントしない とい
った設定がありますでしょうか?)

わかりにくいですが、もしご存知の方がいらっしゃいましたら
、お知恵を拝借させてください。
よろしくお願いいたします。

--環境--
OS:LinuxRedHat9(GNOME,Xwindow使用)
Apache ver1.3.33
Namazu ver2.0.14


--------------------------------------
Know more about Breast Cancer
http://pr.mail.yahoo.co.jp/pinkribbon/




Namazu-users-ja メーリングリストの案内