[Namazu-users-ja 115] Re: Namazu 2.0.13 の filter/excel.pl の問題 ?

Tadamasa Teranishi yw3t-trns @ asahi-net.or.jp
2004年 11月 24日 (水) 22:29:36 JST


寺西です。

Taiji.Can @ grd.advantest.co.jp wrote:
> 
> > Perl のバージョンも怪しいのですが、OS に依存する可能性もあり、
> > はっきりわかっていません。
> 
>  OSは先ほども書きました。名称でいえばMiracle の Miracle Linux 3.0(Asianix?)を
>   使っています。
> 
> drastic:manager# perl -v
...
>   ですので、古くは無いと思うのですが。perlは元々入っていたものを
>  利用しています。

やはり、Perl のバージョンだけの問題ではないということのようですね。

# perl -V
...
    config_args='-des -Doptimize=-O2 -g -pipe -march=i386 -mcpu=i686
-Dmyhostnam
e=localhost -Dperladmin=root @ localhost -Dcc=gcc -Dcf_by=Red Hat, Inc.
-Dinstallp
refix=/usr -Dprefix=/usr -Darchname=i386-linux -Dvendorprefix=/usr
-Dsiteprefix=
/usr -Dotherlibdirs=/usr/lib/perl5/5.8.0 -Duseshrplib -Dusethreads
-Duseithreads
 -Duselargefiles -Dd_dosuid -Dd_semctl_semun -Di_db -Ui_ndbm -Di_gdbm
-Di_shadow
 -Di_syslog -Dman3ext=3pm -Duseperlio -Dinstallusrbinperl
-Ubincompat5005 -Uvers
iononly -Dpager=/usr/bin/less -isr'
    hint=recommended, useposix=true, d_sigaction=define
    usethreads=define use5005threads=undef useithreads=define
usemultiplicity=de
fine
    useperlio=define d_sfio=undef uselargefiles=define usesocks=undef
    use64bitint=undef use64bitall=undef uselongdouble=undef
    usemymalloc=n, bincompat5005=undef
  Compiler:
    cc='gcc', ccflags ='-D_REENTRANT -D_GNU_SOURCE -DTHREADS_HAVE_PIDS
-DDEBUGGI
NG -fno-strict-aliasing -I/usr/local/include -D_LARGEFILE_SOURCE
-D_FILE_OFFSET_
BITS=64 -I/usr/include/gdbm',
    optimize='-O2 -g -pipe -march=i386 -mcpu=i686',
    cppflags='-D_REENTRANT -D_GNU_SOURCE -DTHREADS_HAVE_PIDS -DDEBUGGING
-fno-st
rict-aliasing -I/usr/local/include -I/usr/include/gdbm'
    ccversion='', gccversion='3.2.2 20030222 (Red Hat Linux 3.2.2-5)',
gccosandv
ers=''
    intsize=4, longsize=4, ptrsize=4, doublesize=8, byteorder=1234
    d_longlong=define, longlongsize=8, d_longdbl=define, longdblsize=12
    ivtype='long', ivsize=4, nvtype='double', nvsize=8, Off_t='off_t',
lseeksize
=8
    alignbytes=4, prototype=define
以下省略

など、Perl のコンパイルオプションの違いとか、gcc のバージョンの
違いだとか、リンクするライブラリの違いとかかもしれません。
# 結局、よく分かっていないのですが。

> > おそらく特定のファイルを処理した場合に非常に時間がかかっている
> > のだろうと思われるので、そのファイルを調べれば解決策が見つかる
> > と思っています。
> > もし、そのようなファイルを見つけて、提供いただけるようでしたら
> > ご協力ください。
> 
>  そうですね。ちょっと出せるか確認してみます。ただ、ほとんどのxlsで起きて
>  いるので最初にxlhtmlをrenameして xls 抜きでindexを作ってそれから xlhtmlを
>  戻してmknmzを行うと500個位のxlsファイルが3日かけても終わりません。

もしほとんどの Excel ファイルで起こるのであれば、同じ症状が出る
ような提供いただけるサンプル Excel ファイルを簡単に作ったりは
できないでしょうか?

>  HardはCPUが2個(2.8GHz)、メモリは2GB載っているのでそこそこなマシンだと
>  思っています。

ハードウェアの性能は、この際あまり関係ありません。
# もちろん速いマシンの方がより有利だとは思います。

環境によっては、パターンマッチングの処理で非常に多くの時間がかかって
いるためで、最悪の場合はほぼ無限に時間がかかるかもしれません。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns @ asahi-net.or.jp
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E




Namazu-users-ja メーリングリストの案内