[Kakasi-dev 26] Re: Text::Kakasi::do_kakasi で分かち書きを行った際に文字化けが起こることがある問題について

Tadamasa Teranishi yw3t-trns @ asahi-net.or.jp
2005年 5月 31日 (火) 23:14:42 JST


寺西です。

amatubu wrote:
> 
> 他の文字でも試してみたところ、どうも euc-jp での文字
> コードの 1 バイト目が「Ex」となっている文字が最初に
> あると問題が起こるような感じです(それだけが原因か
> どうかもわかりませんが)。

kakasi コマンドでも発生することを確認しました。

# echo 蚫です。Kakasiの分かち書きで問題が起こる文字があるようで
す。 | kakasi -w
蚫 です。 Kakasi の分かち書きで 問 題 が起こる文字がある よ うです。
# echo これは蚫です。Kakasiの分かち書きで問題が起こる文字がある
ようです。 | kakasi -w
これは 蚫 です 。 Kakasi の 分か ち 書き で 問題 が 起こ る 文字 が
あるようです。

指摘のように 0xe* の文字で問題が起こるようですね。
--
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns @ asahi-net.or.jp
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E




Kakasi-dev メーリングリストの案内