Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: ms-word ドキュメントのヘッダ、フッタは検索対象になるのか ( ソースがついて長文です。)



寺西です。

Amuro Ray wrote:
>  
> ご指摘のwvWareのtext出力ですが、manと--helpをみるとオプ
> ション付けではなく、wvTextというスクリプトで行うようです。
> 
> 結果ですが、wvTextでHTMLを作成したら問題なく、ヘッダ、フ
> ッタが含まれていました。
...
> 解決の鍵になるかわかりませんが、今の環境のWordフィルタの
> スクリプトファイルを添付しますので、引き続きご助言をお願
> いします。

うーむ。メーリングリストに流すのはあまりよろしくないです。
しかし、 おかげで解決の糸口は見つかりそうです。

>     {
>         my $fh = util::efopen("< $tmpfile2");
>         $$cont = util::readfile($fh);
> 
>         # Exclude wvHtml's footer becaues it has no good index terms.
>         $$cont =~ s/<!--Section Ends-->.*$//s;
>     }

というところで、フッタを削除している部分があります。
(ヘッダについは不明ですが、ヘッダも削除されているのかも
しれません。)

ので、以下のようにコメントアウトすれば、目的が果たせるかもしれません。

    {
        my $fh = util::efopen("< $tmpfile2");
         $$cont = util::readfile($fh);

        # Exclude wvHtml's footer becaues it has no good index terms.
#         $$cont =~ s/<!--Section Ends-->.*$//s;
    }
--
寺西