Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: UTF-8 index



佐久間です.



> 臼田です。
> 
> "Sakuma,Hiroaki" wrote:
> 
> > > また、Unicode::MapとUnicode::Stringを使ってまでPerl5.6対応にしなければ
> > > いけない理由があればぜひ修正案をください。
> > > 
> > > これらのモジュールの追加で対応するならすっきりPerl5.8を要求したほうが良
> > > いと
> > > 私は思います。
> > 
> > レンタルサーバの多くは,未だPerl5.005〜5.6で,5.8に移行しているサービスは
> > 多
> > くありません.私の場合も,4つのサービスを利用していて,全て5.6を使用して
> > いま
> > す.
> > 
> > UTF-8からEUCへの変換は,
> > 
> > sub utf82euc {
> >   return Unicode::Map->new("EUC-JP")->from_unicode(utf8("$_[0]")->ucs2);
> > }
> > 
> > EUCからUTF-8への変換は,
> > 
> > sub euc2utf8 {
> >   return ucs2(Unicode::Map->new("EUC-JP")->to_unicode("$_[0]"))->utf8;
> > }
> > 
> > と一発で出来るので,これで対応して頂けると,5.6環境でUTF-8を使いたい場合
> > にも
> > 対処できると思います.
> 
> utf8index-branchでのpl/codeconv.plを見ていただけるとわかりますが
> 
> euc<->utf-8だけでなく、
> shift-jis, 7bit-jis, UTF-16BE, UTF16-LE の変換
> MIME-Encodeのデコード、正体不明の日本語コードの判定
> をできるようにしなければなりません。
> 
> これらをnkfなしのPerl5.6でサポートできる案であれば対応したいです。

nkfは使っても構わないのですが,5.8が必須となるようだと困ります.Shift-JISや
JISとの相互変換はUnicode::Mapでも出来ます.Perlのネイティブな機能を使ってい
るところを,5.6でも使えるように対応して欲しいだけで,日本語コードの判定など
はnkf任せで構わないと思います.



> namazu2.1がリリースできるころには世の中のサーバの大半もPerl5.8
> が使えるようになっているのではと期待して作業しています。

期待は外れると思います.サーバ業界のバージョンアップは思ってるより遅く,今で
も5.6より5.005を使ってるサイトの方が多いというのが実感です.
# 実際に調査したわけではありません
リリースできるころというが,何年後かわかりませんが,5.6に対応できないとなる
と,2.0を使い続けなくてはいけなくなってしまいます.



=== Sakuma,Hiroaki =======================================================
BEETAS.org          www.beetas.org      sakuma@xxxxxxxxxx
Webmin-JP           jp.webmin.com       sakuma@xxxxxxxxxxxxx
Waseda Univ CS                          sakuma@xxxxxxxxxxxxxxx
=== "There's More Than One Way To Do It" =================================