namazu-ml(avocado)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Namazu 1.2.0.1 - バグ (?) レポート



つい最近、このMLに入りました。山名@電総研と申します。
どうぞ、よろしくお願いいたします。_(_o_)_

Namazuは、1.0.3の時から、研究のプラットホームとして使わさせて
いただいております。主として、並列計算機を使った検索の並列化
を行っております。

さて、この度、1.2.0.1 について、以下の不具合をみつけましたので
報告させていただきます。

●バグレポート

使用ソフト等: jperl5.004_03-970819 + Namazu1.2.0.1
              Solaris 2.6 , Sun Enterprize 450
現象        : mknmzでインデックス作成時にフリーズする場合がある
回避策      : mknmz  -K オプションをつけ記号をインデックス化しない
              ようにする

上記現象の現れるページ:
              http://www.etl.go.jp/etl/donald/mule/mule.ko.html
原因        : このページはiso-2022-krコードで書かれていることが原因
              だと思われる
フリーズポイント: sub count_words中の
  ===================================================
                $part1 = $$contents;  # 普通の部分
                $part2 = $$contents;  # 重みづけ部分
  この部分→    $part1 =~ s/(.*?)(\t.*)/$1/s;
                $part2 =~ s/(.*?)(\t.*)/$2/s;
  ===================================================
考えられる対策: ヘッダ中にcharsetの記述があれば、チェックして
                日本語/英語以外はスキップさせるなど..

==
=-=-=-=-=-=-=-=-=-=-=-==-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=
山名 早人(やまな はやと)             <URL:http://www.etl.go.jp/~yamana/>
            【通産省 工業技術院 電子技術総合研究所 情報アーキテクチャ部】
                                      〒305-8568 茨城県つくば市梅園1-1-4    
               Tel:0298-54-5955  Fax:0298-54-5882 E-mail:yamana@xxxxxxxxx
  Search any infomation in ETL <URL:http://www.etl.go.jp/~yamana/Search/>