Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

ファイルが巨大...および excel.pl など



NAMAZUを使い始め、メーリングリストなどを参考にして色々やってみて、
どうしても分からないところがあります。

先ずは、サンプルとしてtestsフォルダに入っているword6.docとword95.docが
  未対応の形式:word7
となって、インデックス化できないことです。wvWareでは対応しているようで
すが、何が問題なのでしょうか。

次に、インデックス化のときに
  ファイルが巨大なので無視します。
となり、処理されないことです。どうも、PDFファイルで起きているようです。
ファイルサイズは1MB台のものです。
関係ないと思うけど、試しにmknmzrcのテキストサイズの最大を10MBに設定し
ましたが駄目でした。他の形式で同じエラーが起きていたのは、起きなくなっ
たのですが...。

最後はexcel.pl。
最新の昨年12月の版にするとexcelファイルが未対応の形式になってしまいます。
最初から入っている昨年4月の版ですとOKです。
ファイルの違う点は
  昨年4月の版 : system("$xlconvpath
  昨年12月の版 : util::systemcmd("$xlconvpath
のようですが...。

インストールしてあるのは以下のものです。
気になるのはwvWareインストール時にwarning:ISO何とかが出たことです。
MS-Word処理時にこれが出ることがあります。表向きには支障らしきものは
出ていませんが...。

OS:RedHat7.1J
RedHat7.x用のNAMAZUのrpmパッケージすべて
xlHtml-0.2.8.tar.gz
lv4494.tar.gz
wv-0.6.5.tar.gz
libwmf-0.2.0.tar.gz
xpdf-0.92.tgz
detex-2.7-1.i386.rpm
filter.tar.gz(excel.pl以外)(http://cvs.namazu.org/namazu/filter/から)

一応、上記の問題点以外はtex、html、pd、fMs-Word、MS-Excel、
MS-PowerPoint、g-zipのインデックス化は出来ているようです。

以上、宜しくお願いします。



北川文孝
kitagawa@xxxxxxxxxxxxxxxxxx