[Namazu-users-ja 739] Re: mailnews.pl with --decode-base64

Tadamasa Teranishi yw3t-trns @ asahi-net.or.jp
2006年 4月 20日 (木) 21:57:04 JST


寺西です。

"Hideyuki SHIRAI (白井秀行)" wrote:
>
> shift_jis な text (file名は *.txt) を app/oct で送ってくるメーラっ
> て世の中結構あるので、これは救ってもらえるとうれしいです。
> 
> # というか、うちの会社多い ^^;;;

こういうおかしなものは、できれば正式な対応というよりは、アンオフィ
シャルなパッチで、サイトの判断で個々で使っていただきたいなぁと思い
ます。

それと、そういう困ったメーラは駆逐していただくのがよろしいかと。

とは言いつつ...。
  
> > > (1) App/Oct として base64 したパートを付ける
> > >  test.1 app/oct(euc-jp)
> > >  test.2 app/oct(iso-2022-jp)
> > >  test.3 app/oct(shift_jis)
> > >  test.4 app/oct(utf-8)
> >
> > これをテキストとして取り出し、なおかつ漢字コード変換を行って
> > いるのはまずいと思いますので、このパートは捨てるようにしたいと
> > 思います。

と、やみくもにテキストだと決めうちで処理しているのかと思いましたが..。 

> 現状は、拡張子で text/plain と判断しているようですが、そのままで
> よいのではないでしょうか?

多段処理においてテキストデータであると判断し、そこで救い出して
いるので、結果的にデータが生きているということでした。

なので、わざわざ殺すこともないとも思い直しましたので、現状維持と
します。
# 結果的には、先のアンオフィシャルなパッチで救うという先の話はなく
# なるわけです。

> 同様に app/oct で *.doc, *.xls なんていうのもよくありますよね。

まぁ、バイナリはそれでも良いかとは思いますが。

それで、フィルタの中身を確認したところ、
マルチパートで base64 の text/plain に関してはコード変換処理が
明らかに抜けており、ISO-2022-JPと仮定しています。これはバグでしょう。

本文が base64 のエンコードには、そもそも対応していないということ
なのですが、今回対応しても良いかなと。

> 日本語のメールで一文字だけ iso-2022-jp で表現できないものが入っ
> ていたら shift_jis, utf-8 を使うメーラは良くあると思いますし、別
> に間違っているわけでもありません。なので、これも積極的 :-) にサ
> ポートしたいところです。

別に間違っていないので対応しようかとは思いますが、どちらと言えば
あまりこういったメーラの仕様は関心しませんので、積極的に対応したい
とは思いません。逆に、消極的な対応となります。

で、プログラムをいろいろ書いていると、結局、白井さんのパッチと
あまり変わらないものになりました。
スタンスは違って能書きをいろいろ書きましたが、結局ものは同じってこと
です。特に元のパッチに問題等はありません。

もう少しテストした上で、commit します。
--
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns @ asahi-net.or.jp
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E




Namazu-users-ja メーリングリストの案内