Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: 長い単語の排除



寺西です。

Tadamasa Teranishi wrote:
> 
> uuencode は、ヘッダ文字からフッタ文字まで削除。BinHex はヘッダ文字
> 以降全て削除となっているようです。
> 
> > Base64もついでに、、というのは難しいでしょうか?
> 
> Base64 というか、MIME 形式の multi-part message には対応して
> いないので削除されていないということのようです。

(補足)
MHonArc は MIME 形式の multi-part message に対応しているので、
Base64 が削除されないとしても、それほど困ることはありません。

> 削除するだけなら、まだ簡単そうですが multi-part message をばっさり
> 削除するわけにもいかず、
> Content-Transfer-Encodeing: が、base64 または quoted-printable の
> ものだけ削除するという仕様が、とりあえず実装するには良いかも
> しれません。

やるとしても、message/rfc822 に関してだけです。

> > >> 例1 BASE64らしき記号
> ...
> > これは、検索した結果、やはりWordをBase64でエンコードした電子メールでした。
> 
> 添付ファイルということですね。やっぱり削除したいですね。

MHonArc を使えば、添付ファイルは別ファイルに分離され、リンクする形に
なります。このため、Base64 が NMZ.w に含まれることはないはずです。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E