[Namazu-devel-ja 243] Re: Win32 でのfilter 動作検証 (msword.pl, excel.pl,powerpoint.pl)

Yukio USUDA m6694ha392t @ asahi-net.or.jp
2004年 10月 10日 (日) 15:16:45 JST


臼田です

Tadamasa Teranishi wrote:
> > 
> > Win32 で STABLE の filter の動作を少し確認してみました。
> 
> # 微妙に先行してますね。^^; まだ、その準備ができていないです。
>  
ちょっとフライングでしたね。

> > *filter/msword.pl
> > Project: GnuWin32 にコンパイル済みの wvWare があるのでこれをインストールし、
> 
> syscmd を util.pl に入れて、util::systemcmd の代わりに utill::syscmd 
> を使うように書き換えるということをします。
>  
util::syscmd への変更が commit されたら改めて試してみます。


> > *filter/{excel.pl, powerpoint.pl}
> > xlhtml の Web サイトから Win32 用のバイナリを取得し c:\namazu\bin に入れま
> > した。
> > 一見問題なさそうなのですが、tests/data/ja/excel95.xls については本文で文字
> > 化けが生じました。古いバージョンの excel ファイルの内部コードが sjis であ
> > るためかと思いますが要調査です。
> 
> これは lv の問題では? (違うかな)
>  
どうもDOSでの改行コードのマッチングの問題のようです
	if ($$cont =~ m!^<FONT SIZE="?-1"?><I>Last Updated(&nbsp;using| with) Excel 5.0 or 95</I></FONT><br>$!m) 

の最後の $ をとってしまえば正常に動作しました。
	if ($$cont =~ m!^<FONT SIZE="?-1"?><I>Last Updated(&nbsp;using| with) Excel 5.0 or 95</I></FONT><br>!m) 

バージョン判定にしてはかなり厳密なマッチングをしているので
この改行コード条件を外しても十分と思います。

これも util::syscmd に替えると自然に治るのかもしれません。

臼田幸生




Namazu-devel-ja メーリングリストの案内