namazu-ml(avocado)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
正規表現での検索( その2)
- From: Kenji Suzuki <kenji@xxxxxxxxxxxxxxxx>
- Date: Mon, 22 Jun 1998 18:06:28 +0900
- X-ml-name: namazu
- X-mail-count: 00873
Kenji@INSEKI です.
その後ですが,やはり変わりません.
#indexer が同じ(1.2.0-beta-10)なので,当然ですが.
mknmz での NMZ.w は単語がかなり重複しています.
wdnmz -iw NMZ.i し作りなおしたものとの diff は
http://www.inseki.gr.jp/~kenji/search/NMZ.w.diff.txt
の通りです(1MBちょっとあるので注意).
試しに 400 file ほどの小さな index をつくってみ
ましたが,その時は,
wdnmz -iw NMZ.i しても NMZ.w は同一でした.検索も
うまくいくようです.
index が大きくなると,ずれるようですが,原因はわ
かりません.
$ namazu -d /fuck/
DbNames[0]: /home/users/kenji/FS/Index/NMZ
-n: 20
-w: 0
key: [/fuck/]
KeyItemN: 1
検索結果
re: fucker, (242661:fuck), 1, 1
re: fuckin, (242662:fuck'in), 4, 5
re: fuckin', (242663:fucked), 2, 5
re: fuckin-pic, (242664:fucker), 2, 5
re: fucking, (242665:fuckin), 3, 5
re: fuction, (242666:fuckin'), 1, 6
re: fudaba, (242667:fuckin-pic), 36, 42
re: fudaba@xxxxxxxxxxxx, (242668:fucking), 35, 42
re: stand-by, (344089:stand,*fuck), 1, 43
re: stand-in, (344090:stand,*fuck*), 1, 44
という感じです.
私以外の環境では,この現象はないのでしょうね.
うーむ,困ったものだ...
#indexing に 10時間以上かかるので,簡単に他のマシンで
#ためすわけにはいかないな〜.
______________________________________________________________
Kenji Suzuki <kenji@xxxxxxxxxxxxxxxx> INSEKI Fukui Search
福井の全てが検索可能!? http://www.inseki.gr.jp/‾kenji/search/
_______________ Inseki is Not ganSEKI internet service. :-) __