[Namazu-devel-ja 300] Re: ja_JP.UTF-8でのgroffの挙動

Tadamasa Teranishi yw3t-trns @ asahi-net.or.jp
2004年 10月 18日 (月) 20:57:03 JST


寺西です。

NOKUBI Takatsugu wrote:
> 
>   詳しく調べてゆくと、groffの問題に突き当たりました。最新のgroffは、
> LANGによって想定される入出力エンコーディングが決まるようです。そのため、
> EUC-JPで記述されたdata/ja/man.1が正しく処理されず、このような結果にな
> るようです。

# うすうすというか、予想していました。

おそらくこれは groff に限ったことではないでしょう。

LANG に依存して、入力エンコーディングが決まる外部ツールは、いろいろ
とあると思いますし、そういったツールに対応できる(べきとはいいませんが、)
対応できると良いだろうとは思います。

>   正常に動作させるためには、roffソースをLANGに対応したencodingに変換し
> た上で、なおかつ対応したオプション(EUC-JPなら-Tnippon, UTF-8なら
> -Tutf8)を指定させる必要があります。

そうするのが良いと思います。
 
>   GNU/Linux環境やFreeBSD/NetBSDではlocale chamapの実行結果を用いれば済
> みそうなのですが、他の商用OSではどのように対応するのが正しいのかちょっ
> とわかりません。

必要なら環境変数の設定をした上で、
現在の HEAD, STABLE では toeuc で変換して -Tnippon で処理する。
utf-8 ブランチなら、toutf8 というもの(入力エンコーディング自動認識、
出力は UTF-8)があれば、それで処理して、-Tutf8 で処理するというのが
良いのでしょう。

# locale chamap のチェックは不要かと。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns @ asahi-net.or.jp
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E




Namazu-devel-ja メーリングリストの案内