Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: セクション区切りを含むMS-Word文書のインデックス作成の不具合( namazu-bugs-ja#2683)



寺西です。

nature_photo@xxxxxxxxxxxxxx wrote:
> 
> [動作確認結果]
> http://cvs.namazu.org/namazu/filter/msword.pl
> からmsword.pl(v1.28.4.8)をダウンロードしたが、mknmz実行時に以下の
> エラーが出てインデックスは作成不可であった。
>
> 1/1 - /home/user/test/mki/sec.doc Undefined subroutine &codeconv::normalize_eucjp called at /usr/local/share/namazu/filter/msword.pl line 150.

pl/codeconv.pl を更新する必要もあります。
(その他のファイルにも依存する部分もあるかもしれません。)

なお、filter/msword.pl のみ差し替えるのではなく、stable-2-0 の 
Namazu を使っていただくのが何かと安全です。
 
> 当方の環境で以下のような問題があります。
> 
> 1.docファイルによっては、wvWare実行時に「Invalid Seek」エラーが
> 発生する。
> このエラーが発生するdocファイルでInvalid Seekエラーが出続けて、
> wvWareのフィルタリングがなかなか完了しないため、インデックス
> 作成に時間がかかる。

wvWare の問題です。wvWare のバージョンを上げてみると改善する
かもしれませんが、それでも発生したのではないかと思います。
(後述の画像絡みだったかな)
 
> 2.インデックス作成時に、インデックスディレクトリに以下のような
> テンポラリ画像ファイルが残ってしまうが、これが結構な容量(数十MB)
> を食ってしまう。

Namazu の用途にのみ使うのであれば、wvWare のコンパイルの際に
画像を処理しないように設定して作ると良いです。
あるいは wvHtml の中の wv_opts= に -1 を指定するという手も
あります。

ただ、以下の対応を Namazu 側で行うことは良いことでしょう。

> できましたら、wvWareが-1オプションに対応しているバージョンで
> あれば、wvHtmlの代わりに wvWare -1 を使うようにして頂けると
> ありがたいのですが、いかがでしょうか?

wvWare のバージョンごとにオプションがいろいろと異なるのが
厄介で、現状でもかなりの条件分けをしています。
もうひとつ条件分けするのも別に良いでしょう。
# そろそろ、古いバージョンへの対応はやめたいものだが。

ただ、-1 がいつから使えるようになったのかを調べるのが
大変なので、適当なバージョン以降に付けるということになるかとは
思います。
# 後は引数の数が異なっているので、少々面倒ですが。(特に HEAD)
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E