namazu-ml(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: mknm zでのインデックス作成に時間がかかりすぎて困っています。



"K.Suehiro" <suehiro@xxxxxxxxxxxxxxx> wrote:

>「日本語全文検索システムの構築と活用」を参考にして、メールの全文検索をする2週間
>ほど前にシステムが動き出しました。
>テストの段階で、メールが50通ぐらいであれば、1通当たり、数秒で処理され、100通
>を超えると約1分かかるというの把握していたのですが、下記にありますように、急激
>に処理時間が延びてしまっています。昨日は、バージョンを1.2.0.1から1.3.0.8にア
>ップして動かしてみたのですが、結果は捗々しくありません。

メイル 1通あたり 1分とは異常な遅さですね。


>1.パソコンのスペック
> 型式 FLORA 350CV DV1(日立製)
> CPU AMD−K6−2 with 3DNOW 300MHz
> HDD 3.2GB(内Windows98で2GB、Linuxで1GB)

メモリはどのくらい積んでいますか? 64 MB くらいあれば充分な速
度が出るはずです。 16 MBくらいだととてつもなく遅いでしょう。 


>4.症状
>・下記の動作記録のように、インデックス作成の対象となるメールが増えると、急激に
>インデックス作成時間が増える。

ありがちなミスとしては、$ON_MEMORY_MAX をキロバイト単位と勘
違いして 5000000 から 5000 に減らしてインデックス作成の速度
が急激に落ちてしまう、という状況が考えられます。

あるいは mknmz に -h オプションをつけ忘れたのが原因で、巨大
な添付ファイルつきのメイルを処理するのに異常に時間がかかって
いるのかもしれません。

ところで、末広さんはどんなメイルを対象にしているのでしょう? 
通常のメイルならおおよそ一通あたり 1秒程度で処理できるはずで
す。もちろん、処理速度はマシンの性能によりますが。


>6.動作記録(添付ファイルで、Excelの表をつけてあります)

Excel のファイルを添付されては困ります。(Excel のファイルを
扱えない環境の人が多いと思うので)

-- Satoru Takabayashi