[Namazu-users-ja 972] Re: base64のtext/plainとapplication/***の区別

brt83722 @ biglobe.ne.jp brt83722 @ biglobe.ne.jp
2007年 6月 20日 (水) 14:41:33 JST


中田と申します。いつもお世話になっております。
ご回答ありがとうございます。

Yukio USUDA wrote:
> --decode-base64 で添付ファイル等を展開する際に、
> 添付ファイルのファイル名をチェックしています。
> 添付ファイルの中にインデックス対象としたくないタイプ
> のファイルがあるのでしたら
> mknmzrc の $ALLOW_FILE から該当添付ファイルが
> 用いている拡張子を外すことで対応できるはずです。

当方の mknmzrc の設定は次のようになっております。
 $ALLOW_FILE ="|\\d+|[-\\w]+\\.[1-9n]|.*\\.wem|.*\\.olf";
(検索対象としているメールファイルの拡張子は .wem または
  .olf です。)
mknmz 実行時には --mailnews と --decode-base64 を
オプションで付けております。

しかし、以下のようなケースですと添付ファイルに対しても
インデックスが作成されることを確認いたしました。

【メールの添付ファイル名】
config.xml
【本文の部分のヘッダ】
Content-Type: text/plain; charset=iso-2022-jp
Content-Transfer-Encoding: 7bit
【添付ファイルの部分のヘッダ】
Content-Type: application/octet-stream; name="config.xml"
Content-Transfer-Encoding: base64
Content-Disposition: attachment; filename="config.xml"

例えば、上記メールについて true というキーワードは
添付ファイル"config.xml"中にのみ出現しますが、
実際に true で検索すると上記メールもヒットします。
(本文中には true というキーワードは出現しません。)

以上のようなケースについて、当方の認識間違いなど
ありましたら教えていただけませんでしょうか?

以上、よろしくお願いいたします。



Namazu-users-ja メーリングリストの案内