[Namazu-users-ja 822] Re: namazu/namazu.cgiで core-dump

Tadamasa Teranishi yw3t-trns @ asahi-net.or.jp
2006年 9月 14日 (木) 16:50:45 JST


寺西です。

報告ありがとうございます。

taguchi @ iij.ad.jp wrote:
>  
> [現象]
> namazurcのMaxHitを上回る出現件数の検索語は、結果表示から無視されるのだと
> 思いますが、そうした語が検索語の先頭に現れ、かつ、連続した語となっている
> 場合、namazu,namazu.cgi双方とも、coreを吐いて死亡します。
> 
> 具体的には、
>         「日本の歴史」
> の様な検索語、つまり、日本 の 歴史 というような複数の語からなる検索語
> で、「日本」と「の」がMaxHitを越えている状態であるならば、core を吐きます。

手元の Linux で試してみると、

$ namazu -f namazurc "日本の歴史" .
検索結果

参考ヒット数:  {  [ 日本 (ヒット数が多すぎるので無視しました)  ]  [ の (
ヒット数が多すぎるので無視しました)  ]  [ 歴: 0 ]  [ 史: 0 ]  :: 0 }

検索式にマッチする文書はありませんでした。

となり、問題はありませんでした。
core ダンプする理由はもう少し条件が必要なのかもしれません。

インデックスに含まれる「日本」や「の」の数はどれくらいかわかりますか?

そのインデックスが壊れている可能性はないでしょうか?
nmzchkw.pl で一度チェックしてみてください。
また、インデックスを削除して新規にインデックスを作成した場合でも
同様に問題が起きるでしょうか?

http://www.namazu.org/pipermail/namazu-users-ja/2005-November/000571.html
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns @ asahi-net.or.jp
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E




Namazu-users-ja メーリングリストの案内