[Namazu-users-ja 534] Re: Namazu の検索 Hit 数に関して

biz biz952 @ yahoo.co.jp
2005年 10月 18日 (火) 10:01:14 JST


おはようございます。bizです。
昨日遅らせていただいたメールに自己レスです。
文章がわかりにくかったかもしれませんので、要約いたします
と
Index対象ファイルが4000ファイルしか無いにも関わらず、.namazurc
にあるMaxHitが10000(ヒットする文書数の上限値)なのに「
ヒット数が多すぎるので無視しました」と出るのはなぜでしょ
うか?
MaxHitで定義してある数値は、”ヒットする文書数”ではなく
”ヒットするキーワード数”なのでしょうか?

という質問でした。さらに
上記の仮説だ正しいのであれば、MaxHitの値を上げたいのです
が、私が使用するサーバでは25000以上に上げるとタイムアウ
トになってしまいます。MaxHitの値をより上げるのには、どの
ような方法があるでしょうか?
ちなみに使用しているサーバのスペックは
・pentium3 800MHz
・メモリ512MB
です。環境も以下に再掲載いたします。
> --環境--
> OS:LinuxRedHat9(GNOME,Xwindow使用)
> Apache ver1.3.33
> Namazu ver2.0.14

以上何かご存知の方がいらっしゃいましたらよろしくお願いい
たします。


--- biz <biz952 @ yahoo.co.jp> からのメッセージ:
> こんばんはbizです。
> 当方namazu.cgiを使い検索システムを構築しました。
> ---問題の現象は以下です。
> 検索したキーワードのHit数が多すぎてこのメッセージが出
て
> いることだと思いますが、ある単語で検索すると「ヒット数
が
> 多すぎるので無視しました」というメッセージがでます。
> 
> ---前提条件
> 1.mknmz時に-M(メタタグをフィールド指定検索に用いる
)
> をつけています。
> 2..namazurcにあるMaxHitはデフォルトの10000のままです
。
> 3.この状況でMaxHitを25000以上に増やすと検索結果が1分
返
> 答が帰ってこなく、タイムアウトになります。(おそらくサ
ー
> バのスペックに依存するものかと思いますが...。私のサ
ー
> バの環境では25000以下ですと1秒以内に検索結果が返ってき
ま
> す。)
> 
> ---前置きが長くなりましたが、お聞きしたい点は以下です
。
> ・皆さんはMaxHitの設定をどのくらいにしていますでしょう
か
>> (25000程度で検索できなくなるものなのでしょうか?)
> ・現在index化しているページ数は4000程度ですが、MaxHit
(
> ヒットする文書数)が10000を超えているのに、Hit数がそれ
以
> 上になるのはなぜでしょうか?(もしかして1ページ内にあ
る
> 検索ワードの数をカウントしているのでしょうか?)
> ・Hit数が多く、検索結果が出てこない現象に関して上記に
記
> した前提条件を変えずに検索結果を出す方法はありますでし
ょ
> うか?
> (「1ページ内にある検索ワードの数をカウントしている」
と
> いう仮説が正しければ、1ページ内に1語検索ワードがあっ
た
> らそのページ内はそれ以降検索ワードをカウントしない と
い
> った設定がありますでしょうか?)
> 
> わかりにくいですが、もしご存知の方がいらっしゃいました
ら
> 、お知恵を拝借させてください。
> よろしくお願いいたします。
> 
> --環境--
> OS:LinuxRedHat9(GNOME,Xwindow使用)
> Apache ver1.3.33
> Namazu ver2.0.14
> 
> 
> --------------------------------------
> Know more about Breast Cancer
> http://pr.mail.yahoo.co.jp/pinkribbon/
> 
> 

--------------------------------------
Know more about Breast Cancer
http://pr.mail.yahoo.co.jp/pinkribbon/




Namazu-users-ja メーリングリストの案内