Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: 中国語、韓国語を扱う?



もろです。

『電脳中国学』なんて本を共著で書いている者です。

現状はともかく、将来的にはローカルコードを一つ一つ実装していくの
ではなく、本体は Unicode(特に UTF-8、UTF-16)にし、インデックス
を作るときには JIS や Big5 や GB などのファイルを Unicode にコン
バートしてから処理する、というのが現実的ではないでしょうか。
Microsoft Office 文書は Unicode 化してますし、XML / XHTML 文書が
増えてくると、Unicode 文書も増えてくるでしょうし。

On Tue, 10 Apr 2001 00:57:26 +0900 (JST)
hsaka@xxxxxxxxxxxxxxxxx (Hironori Sakamoto) san wrote:

>   さらに、昨年 GBK に 4bytes 文字を追加
>   して Unicode の上位互換とした GB18030 とよばれる*強制力*をもつ文字
>   コードが制定されています。

補足ですが、GB18030 については、こういうページがあります:
http://www.jaet.gr.jp/gb18030/index.html
「強制力」の話も載っています。要するに、2001年元旦より「(中華人
民共和国)国内のあらゆる文字情報処理製品が」この規格を「採用する
よう義務づけ」られた、ということです。

Shigeki Moro
moro@xxxxxxxxxxxxxxx
http://www.ya.sakura.ne.jp/~moro/
My Public PGP Key: 
http://www.ya.sakura.ne.jp/~moro/profile/pgp.html