[Namazu-users-ja 1062] Re: gcnmz が非常な時間を要するようになった

野宮 賢 / NOMIYA Masaru nomiya @ galaxy.dti.ne.jp
2008年 4月 6日 (日) 23:43:31 JST


野宮です.

ご面倒をお掛けし,申し訳ありません.m(_ _)m

In the Message; 

  Subject    : [Namazu-users-ja 1061] Re: gcnmz が非常な時間を要するようになった
  Message-ID : <47F8CECF.F39099BD @ asahi-net.or.jp>
  Date & Time: Sun, 06 Apr 2008 22:23:27 +0900

[寺西さん] == Tadamasa Teranishi <yw3t-trns @ asahi-net.or.jp> has written:

小生>> 愕然としています.インデックスファイルのサイズが違い過ぎる,と.

寺西さん> やっと、

^^;;;

寺西さん>> たぶん、インデックスのサイズがその前後で随分変わったんではないかと
寺西さん>> 思いますよ。

寺西さん> この話に戻ってきましたが、だから gcnmz の処理時間が何倍にもなった
寺西さん> のでしょう。

寺西さん> という話を最初の方から言っているわけですけど...。

....<(_ _)>

小生の保有するファイル群の場合,</html>タグ以下を無視する,というFilterでは
駄目で,Content-Type: image/* なマルチパートを無視するというFilterにしなけ
ればならないようです.
つまり,ファイルに拠っては,元記事が複数ページに亘る,即ち,

<html>
<body>
本文1
</body>
</html>

<html>
<body>
本文2
</body>
</html>

Content-Type: image/*
[...]

という形式のものがあるからです.

全て 1ページなら -h オプションを使えるのですが.

ともあれ,Content-Type: image/* を無視するFilterが mailnews.pl にあるという
ところまでは解りました.
精進しなければ.....

---
  野宮  賢             mail-to: nomiya @ galaxy.dti.ne.jp
  
    「私たちが今日直面している化学物質の危険性に関する疑問に対し、通常の
     科学的な正確さをもって答えようとすれば、たぶんさらに数十年を要するで
     あろう。」                                      -- J. V. Rodricks --


Namazu-users-ja メーリングリストの案内