namazu-ml(avocado)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: 正規表現での検索 (その 2)



Kenji Suzuki <kenji@xxxxxxxxxxxxxxxx> wrote:

>mknmz での NMZ.w は単語がかなり重複しています.

えっと、今見直してみたら変なところが見つかりました。 mknmz.pl の
&put_index() の中の

		else {
		    $n = pack("I", $n);
		    $_ = "$words[$cnt]\n$n$record\n";
!		    print TMP_W "$current_word\n"
!			unless ($NoRegexpIndexOpt);
		    print TMP_I;
		    &indexingmisc($words[$cnt],  \$hash_ptr,
				  \$hash_count, \$key_count, length($_));
		}


の部分が間違っていて、これを

!		    print TMP_W "$words[$cnt]\n"
!			unless ($NoRegexpIndexOpt);

のように修正する必要があります。



>wdnmz -iw NMZ.i し作りなおしたものとの diff は

wdnmz -iw NMZ.i で作った NMZ.w を使った場合、正規表現の検索はうま
くいくでしょうか? それだと安心なのですが。


>index が大きくなると,ずれるようですが,原因はわ
>かりません.

おそらく上記のバグが原因なのではないかと思います。


>#indexing に 10時間以上かかるので,簡単に他のマシンで
>#ためすわけにはいかないな〜.

また試してみてください。

--
高林 哲 Satoru Takabayashi