namazu-ml(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Solaris is too slow.



すぎうらしろうです。

cpu0: SUNW,UltraSPARC-IIi (upaid 0 impl 0x12 ver 0x13 clock 300 MHz)
SunOS Release 5.6 Version Generic_105181-03 [UNIX(R) System V Release 4.0]
Copyright (c) 1983-1997, Sun Microsystems, Inc.
mem = 262144K (0x10000000)

というマシンと、

FreeBSD 2.2.7-RELEASE #0: Fri Feb 26 08:56:06 JST 1999
CPU: Pentium II (300.67-MHz 686-class CPU)
real memory  = 67108864 (65536K bytes)

というマシンでnamazuを使ってRFCをindex化しようとしているのですが異様に
遅くて困っています。<URL:http://www2.umin.u-tokyo.ac.jp/internet/rfc/>
から、rfc*.txtをもって来て1600個でトータル100MByte強です。

遅いと言うのは2つあって、1つは FreeBSD 側の方が現在CPU TIMEで22Hほど作
業をしているのですが、まだ500件ほどしかindex化できていません。mknmzは
50MByteほどしかメモリは消費していないようです。
Perl 5.005_02 と、namazu v1.4.0.0-beta-4 を --without-japanese で使っ
ています。

もう一つはSolarisのほうで、こちらは FreeBSDの方に比べ6倍ぐらい遅いと更
に深刻です。Perl 5.004_4、nkf、kakasiに namau-1.3.0.5でも、v1.4.0.0-be
ta-4 を --without-japanese で使っても同様に6倍ぐらい遅いです。
最初余りにも遅いので Perl を疑い、-O3 オプションを付けて再コンパイルし
た段階で対PentiumII300+FreeBSD比6倍です。perl再コンパイル以前は rfc54.
txt 一つだけをIndex化するのに実時間で10分ぐらいかかりました。

ちなみに、rfc54.txtとrfc105.txtはASCIIでちょっとした絵がかかれているRFC
で、これに時間をとられるのはある程度仕方がないのですが、全体的に遅いの
です。rfc54,rfc105それぞれ約20Kbyteの2つを併せて PentiumII412MHz + Free
BSD2.2.8のマシンでindex化するのにかかる時間は58秒です。

というわけで、英語のみのファイルをindex化すると何か遅い、というのとSola
ris(SPARC)が異常なほど遅いということに困っているわけですが、namazuって
英語のindex化は苦手なのでしょうか?
それと、Solaris(SPARC)がめちゃめちゃ遅いのを何とかする方法はなにかあり
ますでしょうか?

--
    すぎうらしろう(Sugiura Shiro)      E-mail : sugiura@xxxxxxxxxxxx
                                       URL    : None
     御希望の方に、もれなく less-332.tar.gz をプレゼントしています
    [     If you want to talk with me, you MUST speak Japanese     ]