Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Windows以外でRTF文書の文書フィルタの指定方法は?



吉野です。

> 検証して、来週にでも結果を報告いたします。
DocCat Ver3 + rtf文書フィルタに関する結果報告です。
両バージョンとも不具合もなく、正常にインデックスを
作成できています。
処理時間に関しては、msword.pl修正版の方が若干よい結果に
なっていますが、ほとんど変わらないようです。
つまり、お好みのバージョンをお使いください、ということです。

貴重なご意見をいただいた寺西さん、ありがとうございました。

-=-=-処理結果-=-=-
1)msword.pl修正版
文書数=6,592
所要時間	約3時間8分
 File/Sec:            0.57

2)rtf.pl(msword.pl改造)版
文書数=6,600
所要時間	約3時間13分
 File/Sec:            0.58

-=-=-対象文書-=-=-
文書種類=MS-Word95,MS-Word97,MS-Word98,MS-Word2000,PDF

-=-=-メッセージ(rtf.pl版)-=-=-
Added Documents:     6,600
Size (bytes):        958,019,601
Total Documents:     6,600
Added Keywords:      716,214
Total Keywords:      716,214
Wakati:              module_kakasi -ieuc -oeuc -w

-=-=-追伸-=-=-
余談ですが今回の検証で、最新の DocCat にバグがあることが
わかりました。開発元(デ変研)からの回答では4月上旬に
対応版をリリースするとのことです。

******************************************
吉野 茂
******************************************