[Namazu-devel-ja 243] Re: Win32 でのfilter 動作検証 (msword.pl, excel.pl,powerpoint.pl)
Yukio USUDA
m6694ha392t @ asahi-net.or.jp
2004年 10月 10日 (日) 15:16:45 JST
臼田です
Tadamasa Teranishi wrote:
> >
> > Win32 で STABLE の filter の動作を少し確認してみました。
>
> # 微妙に先行してますね。^^; まだ、その準備ができていないです。
>
ちょっとフライングでしたね。
> > *filter/msword.pl
> > Project: GnuWin32 にコンパイル済みの wvWare があるのでこれをインストールし、
>
> syscmd を util.pl に入れて、util::systemcmd の代わりに utill::syscmd
> を使うように書き換えるということをします。
>
util::syscmd への変更が commit されたら改めて試してみます。
> > *filter/{excel.pl, powerpoint.pl}
> > xlhtml の Web サイトから Win32 用のバイナリを取得し c:\namazu\bin に入れま
> > した。
> > 一見問題なさそうなのですが、tests/data/ja/excel95.xls については本文で文字
> > 化けが生じました。古いバージョンの excel ファイルの内部コードが sjis であ
> > るためかと思いますが要調査です。
>
> これは lv の問題では? (違うかな)
>
どうもDOSでの改行コードのマッチングの問題のようです
if ($$cont =~ m!^<FONT SIZE="?-1"?><I>Last Updated( using| with) Excel 5.0 or 95</I></FONT><br>$!m)
の最後の $ をとってしまえば正常に動作しました。
if ($$cont =~ m!^<FONT SIZE="?-1"?><I>Last Updated( using| with) Excel 5.0 or 95</I></FONT><br>!m)
バージョン判定にしてはかなり厳密なマッチングをしているので
この改行コード条件を外しても十分と思います。
これも util::syscmd に替えると自然に治るのかもしれません。
臼田幸生
Namazu-devel-ja メーリングリストの案内