Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: UTF-8 index



臼田です。

"Sakuma,Hiroaki" wrote:

> > また、Unicode::MapとUnicode::Stringを使ってまでPerl5.6対応にしなければ
> > いけない理由があればぜひ修正案をください。
> > 
> > これらのモジュールの追加で対応するならすっきりPerl5.8を要求したほうが良いと
> > 私は思います。
> 
> レンタルサーバの多くは,未だPerl5.005〜5.6で,5.8に移行しているサービスは多
> くありません.私の場合も,4つのサービスを利用していて,全て5.6を使用していま
> す.
> 
> UTF-8からEUCへの変換は,
> 
> sub utf82euc {
>   return Unicode::Map->new("EUC-JP")->from_unicode(utf8("$_[0]")->ucs2);
> }
> 
> EUCからUTF-8への変換は,
> 
> sub euc2utf8 {
>   return ucs2(Unicode::Map->new("EUC-JP")->to_unicode("$_[0]"))->utf8;
> }
> 
> と一発で出来るので,これで対応して頂けると,5.6環境でUTF-8を使いたい場合にも
> 対処できると思います.

utf8index-branchでのpl/codeconv.plを見ていただけるとわかりますが

euc<->utf-8だけでなく、
shift-jis, 7bit-jis, UTF-16BE, UTF16-LE の変換
MIME-Encodeのデコード、正体不明の日本語コードの判定
をできるようにしなければなりません。

これらをnkfなしのPerl5.6でサポートできる案であれば対応したいです。

namazu2.1がリリースできるころには世の中のサーバの大半もPerl5.8
が使えるようになっているのではと期待して作業しています。

臼田幸生