[Namazu-users-ja 112] Re: Namazu 2.0.13 の filter/excel.pl の問題 ?

Yukio USUDA m6694ha392t @ asahi-net.or.jp
2004年 11月 24日 (水) 20:26:42 JST


臼田です

Taiji.Can @ grd.advantest.co.jp wrote:
> 
> > > > Namazu 2.0.12 に比べて Namazu 2.0.13 の場合、mknmz の excel の処理に
> > > > 時間がかかっているそうです。(xlhtml 0.5.1 使用)
> 
>   OS:
> Linux drastic 2.4.21-9.30AXsmp #1 SMP Wed May 26 23:37:09 EDT 2004 i686 i686 i386 GNU/Linux
> 
>   の Namazu 2.0.13 で同じ現象です。
> 
> > その後のやり取りの結果、2.0.13 に 2.0.12 の filter/excel.pl を
> > 入れても遅いそうです。
> > その遅いというのも、4分が 2時間とかのレベルなので、どこかの
> > マッチングで非常に時間がかかっているということなのではないか
> > と思われます。
> 
>   私のところの現状は2時間以上です。xlhtml のプロセスはps で見ても
>   ありません。
> 
> > Excel で症状がたまたま現れたということなのかもしれません。
> > 
> > # となると怪しいのは filter/html.pl ですかねぇ。
> 
>   この結果は何か出ていて既に解決されているのでしょうか?
> -- 
メーリングリストを追って読んでいくとわかりますが
古いバージョンの Perl で '.*?' という正規表現を使ったマッチングに著しく
処理時間がかかることがあるようだという結論になっています。
問題の個所は filter/excel.pl から呼び出されている filter/html.pl 内のどこか
と思われます。

使用している Perl のバージョンは何でしょうか。

同様のものに filter/msword.pl での事例もありました
http://www.namazu.org/pipermail/namazu-devel-ja/2004-September/000137.html
こちらは寺西さんに修正してもらいました。

ただ、 html.pl 内には '.*?' の使用個所がかなりあるので問題の特定と修正は
手間がかかるものと思います。

Perl のバージョンをあげれば通常の処理速度になるかもしれません。

臼田幸生





Namazu-users-ja メーリングリストの案内