namazu-ml(avocado)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

正規表現での検索( その2)



Kenji@INSEKI です.


その後ですが,やはり変わりません.
#indexer が同じ(1.2.0-beta-10)なので,当然ですが.

mknmz での NMZ.w は単語がかなり重複しています.
wdnmz -iw NMZ.i し作りなおしたものとの diff は

http://www.inseki.gr.jp/~kenji/search/NMZ.w.diff.txt
の通りです(1MBちょっとあるので注意).


試しに 400 file ほどの小さな index をつくってみ
ましたが,その時は,
wdnmz -iw NMZ.i しても NMZ.w は同一でした.検索も
うまくいくようです.


index が大きくなると,ずれるようですが,原因はわ
かりません.


$ namazu -d /fuck/
DbNames[0]: /home/users/kenji/FS/Index/NMZ
 -n: 20
 -w: 0
key: [/fuck/]
KeyItemN: 1
検索結果

re: fucker, (242661:fuck), 1, 1
re: fuckin, (242662:fuck'in), 4, 5
re: fuckin', (242663:fucked), 2, 5
re: fuckin-pic, (242664:fucker), 2, 5
re: fucking, (242665:fuckin), 3, 5
re: fuction, (242666:fuckin'), 1, 6
re: fudaba, (242667:fuckin-pic), 36, 42
re: fudaba@xxxxxxxxxxxx, (242668:fucking), 35, 42
re: stand-by, (344089:stand,*fuck), 1, 43
re: stand-in, (344090:stand,*fuck*), 1, 44

という感じです.


私以外の環境では,この現象はないのでしょうね.
うーむ,困ったものだ...

#indexing に 10時間以上かかるので,簡単に他のマシンで
#ためすわけにはいかないな〜.

 ______________________________________________________________
 Kenji Suzuki  <kenji@xxxxxxxxxxxxxxxx>     INSEKI Fukui Search
  福井の全てが検索可能!? http://www.inseki.gr.jp/‾kenji/search/
 _______________ Inseki is Not ganSEKI internet service. :-) __