Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

MHonArc 2.6.3 のバグ(?)について



寺西です。

いろいろと MHonArc 2.6.3 を触っていると、バグに遭遇しました。

MHonArc 処理後の HTML の本文に JIS コードに含まれる '<' がある
場合、これを &lt; に変換するというものです。
mknmz では pre_codeconv の euc に変換時に正しく変換できず、文字化けが
発生します。

tests/data/ja/mail.txt を mhonarc で変換すれば再現できます。

MHonArc が JIS コードに含まれる '<' まで &lt; に変換するのが問題
だと思いますが、MHonArc を修正するのも大変そうです。

UTF8 ならこのような問題は生じないでしょうから、
そろそろ UTF8 で処理できるように mhonarc.pl を書き換えた方が良い
でしょうか?
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E