namazu-ml(avocado)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: 正規表現での検索 (その 2)
- From: Satoru Takabayashi <ccsatoru@xxxxxxxxxxxxxxxxxx>
- Date: Mon, 22 Jun 1998 18:39:36 +0900
- X-ml-name: namazu
- X-mail-count: 00874
- References: <09101569254857@po.ganseki.ne.jp>
Kenji Suzuki <kenji@xxxxxxxxxxxxxxxx> wrote:
>mknmz での NMZ.w は単語がかなり重複しています.
えっと、今見直してみたら変なところが見つかりました。 mknmz.pl の
&put_index() の中の
else {
$n = pack("I", $n);
$_ = "$words[$cnt]\n$n$record\n";
! print TMP_W "$current_word\n"
! unless ($NoRegexpIndexOpt);
print TMP_I;
&indexingmisc($words[$cnt], \$hash_ptr,
\$hash_count, \$key_count, length($_));
}
の部分が間違っていて、これを
! print TMP_W "$words[$cnt]\n"
! unless ($NoRegexpIndexOpt);
のように修正する必要があります。
>wdnmz -iw NMZ.i し作りなおしたものとの diff は
wdnmz -iw NMZ.i で作った NMZ.w を使った場合、正規表現の検索はうま
くいくでしょうか? それだと安心なのですが。
>index が大きくなると,ずれるようですが,原因はわ
>かりません.
おそらく上記のバグが原因なのではないかと思います。
>#indexing に 10時間以上かかるので,簡単に他のマシンで
>#ためすわけにはいかないな〜.
また試してみてください。
--
高林 哲 Satoru Takabayashi