Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: mhoarc/iso2022jp.pl



寺西です。

藤原 誠 / Makoto Fujiwara wrote:
> 
> mhoarch の iso2022jp.pl の < > & を &lt; &gt; &amp に符号化す
> るという方針は間違っているのではないか
> と思っています。( もちろん ESC $ B... ESC の (J  の中の話です)
> text/html; charset=iso-2022-jp とした場合、これらは生で置いて
> おいていい
> と思うのは間違いですか ?

iso2022jp の文字の中の < を &lt; に置換するのは間違いです。

そして、MHonArc の設定が悪いと置換してしまいます。
しかし、適切に設定を行うと iso2022jp 文字の中の < は &lt; に
置換されません。

そしてその適切な設定の例が
http://www.namazu.org/ml/namazu-devel-ja/msg02915.html
であり、これを使うことによってタイトルの文字化け問題は
解決します。(少なくとも 2.6.3 では)

なお、iso2022jp.pl で < > & を &lt; &gt; &amp に符号化すること
自体は問題ではありません。というよりしなければなりません。
これらが漢字コードの一部として現れたときにはしてはいけませんが、
半角文字として現れた時には変換しなければならないためです。
iso2022jp の文字の中の < を &lt; に置換する問題は、iso2022jp.pl
の処理ではなく、別のところで起こります。(iso2022jp の文字列を
iso2022jp だとは認識しないために起こります。)

> やはり一度 euc にして、最後はそのまま出すか、iso-2022-jp に揃
> えるのかなという理解です。( multi-lingual にはなりませんが)。

いえ、適切に設定すれば問題ないはずです。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E