Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: field search bug?



寺西です。

TSUCHIYA Masatoshi wrote:
> 
> >> On Sun, 21 Dec 2003 19:10:35 +0900
> >> yw3t-trns@xxxxxxxxxxxxxxx (Tadamasa Teranishi) said as follows:
> 
> >NFS ですか。ローカルディスクで作業できるスペースはありませんか?
> 
> 了解.他のファイルに問題は発生してないので,無関係だろうとは思いますが,
> 一応念のために確認してみます.

ロックの関係で、NFS では問題が生じる可能性はないわけではないです。
# ただ、本件でそれが問題になるかどうかは別。

> >では、細かなところをチェックしていきましょう。
> 
> > $ wc NMZ.field.subject
> 
> wc: NMZ.field.subject:19636: 無効または不完全なマルチバイトまたはワイド文字です
...
> wc: NMZ.field.subject:106653: 無効または不完全なマルチバイトまたはワイド文字です
>  111823  522938 4636038 NMZ.field.subject

ワーニングらしきものがでるのがちょっと気になりますね。
本件と関係あるかどうかわかりませんが、ちなみに 19636 行前後の内容は
どうなってますか?

$ grep -n . NMZ.field.subject | head -n 19640 | tail

それと、19636 行目までの内容で検索すると、正しい結果が得られる
ということはありませんか?
(emacs-w3m:01000 は、19636 行目以降にあるだろうと予測していますが、
どうだろう。)

> > $ ls -alF NMZ.field.subject.i
> 
> -rw-r--r--    1 tsuchiya users      447292 2003-12-03 17:45 NMZ.field.subject.i
> 
> > $ grep Documents NMZ.log
> 
> Added Documents:     111,823
> Total Documents:     111,823

Total Documents = NMZ.filed.subject.i / 4 = wc NMZ.field.subject
ですので、数は合ってますね。

> それとですね,試しに pnamazu だったらどうなるかなと試してみたら…
...
> うまくいってしまいました.というわけで,インデックス作成時の問題じゃな
> い? のではないかという気がするのですが.

なるほど。namazu の問題ぽいです。

$ namazu --debug "+subject::emacs-w3m:01000" .

の結果はどうなりますか?

こちらは Namazu 2.0.13pre7 でテストしていますが、2.0.12 で再テスト
してみます。
何にしてもこちらで再現しないことには、デバッグのしようもないので
厄介です。データもらうわけにもいかないし。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E