Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: はじめましてタイからの参加です。



 From: knok@xxxxxxxxxxxxx (NOKUBI Takatsugu)
 Subject: [namazu-users-ja] Re: はじめましてタイからの参加です。
 Date: Thu, 6 Sep 2001 15:53:36 JST

 >   しかし、今ちょっと tis620 のコード表をみてみたのですが、この予想は正
 > しくなかったようです ^^; 0x00-0x7f は ASCII と同じようでした。

そうです。タイ文字にはアルファベットの大文字小文字のようなものはな
いので、いわゆる1バイトカナみたいなもんですか。子音文字44個、上下
左右につく母音文字、それに4個の声調記号、黙字記号などだそうですが。

いちおう、環境変数は疑ってみる方がいいかもしれません。LANG=th_TH 
のときはできるだけヘンな処理をしないようにしたつもりですが、むろん
見落としがあるんだろうとおもいます。もうちょっと調べたいところです
が、いまは時間が取れずにいます。すみません。


 > >> マルティリンガルを目指すなら、Unicodeへの対応が必要だと感じ
 > >>ます。開発版の方がどのようになっているかは分かりませんが、近
 > >>い将来、Unicodeに置き換わることは他のプログラムを見ていても目
 > >>に見えています。
 > 
 >   検索は言語に依存した処理も多くあるので、encoding 以外にも障害はいろ
 > いろあるだろうとは予測しています。Unicode (version 3?)だけで解決できな
 > い問題もあるでしょうし、それらも含めてどうすべきかは今後とも検討してい
 > かなければならないと思っています。

同感です。たとえば内部エンコーディングを Unicode にすればいくつか
のマイナーな問題は解決できるのかもしれませんが、別の新たなマイナー
な問題も出てくるでしょうし、そもそも本質的に、Unicode にしさえすれ
ば万事が解決、というほどには単純ではないだろうと言う気はしています。
--
馬場  肇 ( Hajime BABA )                  E-mail: hajime.baba@xxxxxxxxx
国立天文台 天文学データ解析計算センター
--