[Namazu-devel-ja 1171] Re: nmz/codeconv.c(get_external_charset) について

Yukio USUDA m6694ha392t @ asahi-net.or.jp
2006年 8月 25日 (金) 21:20:09 JST


臼田です

On 2006/08/25, at 3:53, Tadamasa Teranishi wrote:

> - "french", "deutsch", "german", "spanish" は ISO-8859-1,
>   "polish" は ISO-8859-2 として扱いますが、"german",  
> "spanish",
>   "polish" はメッセージカタログの方は対応していないので、暫定 
> 状態
>   です。
>
ISO-8859-1 のままだった po/fr.po, po/es.po を utf-8  
に変換しました。

> 従来は US-ASCII 前提の英語を他の国の言語と同様に扱いまし 
> た。
> これは、英語だけが ISO-8859-* を扱えないのも不自然なため 
> です。
> とは言え、全ての環境で利用できる US-ASCII がないのも不便 
> です。
> "en" の扱いを変えて、US-ASCII の "C" と分ける等考 
> えないと
> いけないのかもしれません。
> メッセージカタログと合わせて今後検討していきたいと思います。

多くの文字が表示できる英語環境という意味では
en_US.utf-8 や en_GB.utf-8 がありますが、そういう意味では 
ない
のでしょうか?

本来メッセージ表示の言語、文字コードと
インデックス対象の言語、文字コードは独立しているべきだと思います。
インデックスについては既に --index-lang オプションがあるので
必要に応じて同様のオプションを追加していくことになるのでは
と思います。


>
> なお、これらの修正は HEAD に対して行いましたが、 
> development-2-1 にも
> 評価用に廉価版の get_external_charset() を導入しました。

STABLE の namazu でも iconv を 使うことにした 
のであれば廉価版といわず
  utf-8 ターミナルでの表示にも対応してしまってもよいのではないで 
しょうか。

臼田幸生




Namazu-devel-ja メーリングリストの案内