Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: UTF-8 index



寺西です。

Yukio USUDA wrote:
> 
> > nkf(1) より:
> >        -x     通常おこなわれるX0201仮名->X0208の仮名変換をしないで、
> >               X0201仮名を保存する。入力は、MS-Kanjiの1byte仮名、SO/SI、
> >               ESC-(-I, SSOを受け付ける。出力は、日本語EUC中ではSSO、
> >               JISでは ESC-'('-I を使う。
> >
> -xオプションを試したところ期待通りの動作をしました。
> ファイル名を変換するときは"mXZ1"のかわりに"x"をつけて変換するように
> すれば半角カナ問題はとりあえずは解決ですね。

手元の環境ではうまく動いていないのですが、何か私勘違いしていますかね。
(以下テストした内容です。"カタカナ" は半角です。)

$ echo "カタカナ" | nkf -xs | od -t xCa

0000000 8e b6 8e c0 8e b6 8e c5 0a
         so   6  so   @  so   6  so   E  nl

$ echo "カタカナ" | iconv -f eucjp -t sjis | od -t xCa

0000000 b6 c0 b6 c0 b6 c5 0a
          6   @   6   @   6   E  nl
0000007

余計な 8e が入っているように見えます。

# これは 2.04 で直っているのかもしれないし、直してもらえる可能性は
# 高いのかもしれませんが。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E