[Namazu-users-ja 1130] namazuのキーワード数限界値について

doihr @ nttdata.co.jp doihr @ nttdata.co.jp
2008年 12月 18日 (木) 18:25:55 JST


namazuでインデックスに登録されるキーワード数に限界値が存在するかどうか、
ご存知の方、もしくは、何か知恵をお貸し頂ける方おられましたら、教えてくださ
い。


【事象】
ファイル数、ファイルサイズともに大きなディレクトリに対して、
namazuでインデックス作成しました。
7日間かかりましたが、インデックス作成は無事完了したように
NMZ.logから見受けられます。
↓
[root@**** 23:46:01]# cat NMZ.log
[Append]
Date:                Mon Dec 15 04:33:30 2008
Added Documents:     2,932
Deleted Documents:   452
Updated Documents:   441
Size (bytes):        790,884,389
Total Documents:     390,857
Added Keywords:      150,523
Total Keywords:      108,033,263
Wakati:              module_kakasi -ieuc -oeuc -w
Time (sec):          25,385
File/Sec:            0.13
System:              linux
Perl:                5.008005
Namazu:              2.0.18


しかし、コマンドライン、namazu.cgi(GUI)ともに検索を試みると、
下記のように、インデックスを認識してくれません。
↓
検索結果
参考ヒット数:  [  (インデックスが開けませんでした)  ]
検索式にマッチする文書はありませんでした。
↓
※同様の手法で、数千のインデックス作成に成功しています。
一番大きなディレクトリでのみこの事象が発生しています。


ファイル数と、サイズは当メーリングリストの過去最高記録を
下回っていますが、キーワード数1億以上の実績ってありますか?


Namazu-users-ja メーリングリストの案内