[Namazu-devel-ja 1171] Re: nmz/codeconv.c(get_external_charset) について
Yukio USUDA
m6694ha392t @ asahi-net.or.jp
2006年 8月 25日 (金) 21:20:09 JST
臼田です
On 2006/08/25, at 3:53, Tadamasa Teranishi wrote:
> - "french", "deutsch", "german", "spanish" は ISO-8859-1,
> "polish" は ISO-8859-2 として扱いますが、"german",
> "spanish",
> "polish" はメッセージカタログの方は対応していないので、暫定
> 状態
> です。
>
ISO-8859-1 のままだった po/fr.po, po/es.po を utf-8
に変換しました。
> 従来は US-ASCII 前提の英語を他の国の言語と同様に扱いまし
> た。
> これは、英語だけが ISO-8859-* を扱えないのも不自然なため
> です。
> とは言え、全ての環境で利用できる US-ASCII がないのも不便
> です。
> "en" の扱いを変えて、US-ASCII の "C" と分ける等考
> えないと
> いけないのかもしれません。
> メッセージカタログと合わせて今後検討していきたいと思います。
多くの文字が表示できる英語環境という意味では
en_US.utf-8 や en_GB.utf-8 がありますが、そういう意味では
ない
のでしょうか?
本来メッセージ表示の言語、文字コードと
インデックス対象の言語、文字コードは独立しているべきだと思います。
インデックスについては既に --index-lang オプションがあるので
必要に応じて同様のオプションを追加していくことになるのでは
と思います。
>
> なお、これらの修正は HEAD に対して行いましたが、
> development-2-1 にも
> 評価用に廉価版の get_external_charset() を導入しました。
STABLE の namazu でも iconv を 使うことにした
のであれば廉価版といわず
utf-8 ターミナルでの表示にも対応してしまってもよいのではないで
しょうか。
臼田幸生
Namazu-devel-ja メーリングリストの案内