[Namazu-users-ja 1062] Re: gcnmz が非常な時間を要するようになった
野宮 賢 / NOMIYA Masaru
nomiya @ galaxy.dti.ne.jp
2008年 4月 6日 (日) 23:43:31 JST
野宮です.
ご面倒をお掛けし,申し訳ありません.m(_ _)m
In the Message;
Subject : [Namazu-users-ja 1061] Re: gcnmz が非常な時間を要するようになった
Message-ID : <47F8CECF.F39099BD @ asahi-net.or.jp>
Date & Time: Sun, 06 Apr 2008 22:23:27 +0900
[寺西さん] == Tadamasa Teranishi <yw3t-trns @ asahi-net.or.jp> has written:
小生>> 愕然としています.インデックスファイルのサイズが違い過ぎる,と.
寺西さん> やっと、
^^;;;
寺西さん>> たぶん、インデックスのサイズがその前後で随分変わったんではないかと
寺西さん>> 思いますよ。
寺西さん> この話に戻ってきましたが、だから gcnmz の処理時間が何倍にもなった
寺西さん> のでしょう。
寺西さん> という話を最初の方から言っているわけですけど...。
....<(_ _)>
小生の保有するファイル群の場合,</html>タグ以下を無視する,というFilterでは
駄目で,Content-Type: image/* なマルチパートを無視するというFilterにしなけ
ればならないようです.
つまり,ファイルに拠っては,元記事が複数ページに亘る,即ち,
<html>
<body>
本文1
</body>
</html>
<html>
<body>
本文2
</body>
</html>
Content-Type: image/*
[...]
という形式のものがあるからです.
全て 1ページなら -h オプションを使えるのですが.
ともあれ,Content-Type: image/* を無視するFilterが mailnews.pl にあるという
ところまでは解りました.
精進しなければ.....
---
野宮 賢 mail-to: nomiya @ galaxy.dti.ne.jp
「私たちが今日直面している化学物質の危険性に関する疑問に対し、通常の
科学的な正確さをもって答えようとすれば、たぶんさらに数十年を要するで
あろう。」 -- J. V. Rodricks --
Namazu-users-ja メーリングリストの案内