Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: セクション区切りを含むMS-Word文書のインデックス作成の不具合 (namazu-bugs-ja#2683)



寺西です。

Tadamasa Teranishi wrote:
> 
> > [回避策]
> > /usr/local/share/namazu/filterディレクトリにあるmsword.plの
> >
> > 164         $$cont =~ s/<!--Section Ends-->.*$//s;
> >
> > をコメントアウトし、インデックスを作成する。
> 
> これでは、<!--Sections Ends--> 以降の不要な文書を削除するという
> 本来の意味が失われてしまいます。
> 
> 一番最後の <!--Section Ends--> 以降は削除しないといけないでしょう。

が、少なくとも最近の wvWare はフッタ情報はコメントアウトされて
いるようです。
このため、上記の行をコメントアウトしても実害はありませんでした。

しかし、古いバージョンの wvWare の挙動が不明なことと、フィルタ
作者の意図を考えると、

    $$cont =~ s/(.*)<!--Section Ends-->.*$/$1/s;

とでもしておくのが良いでしょう。早々に commit します。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E