Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: 全角半角変換



弾です。みなさんはじめまして、Perl5.8のEncodeをメンテしてます。あと最近 Text::Kakasi のメンテも引き継ぎました。

http://search.cpan.org/dist/Encode/
http://search.cpan.org/dist/Text-Kakasi/

それで本題です。

On Wednesday, June 4, 2003, at 01:23 PM, Tadamasa Teranishi wrote:
> nkf 相当の変換が必要なんだろうとは思います。ただ、
> EUC になったものを nkf で変換するのは無理みたい
> (EUC半角カナ を入力すると、無視される)
> ですので、Unicode から SJIS に変換した後、toeuc で EUC に変換
> するといった面倒なことになるのかもしれません。

実は Perl 5.8 なら、CP932 から Unicode への変換、機種依存文字の全角/半角化、そしてそれをEUC-JPに落とすということが同一の Perl Script の中で全てできます。

これを利用したちょっとした Hook が、 Text::Kakasi 2.04 に入っているので参照してみてください。

これを利用すれば、NamazuのindexそのものをUTF-8で作るということも可能なはずで、暇があれば取り組んでみたいのですがちょっと手いっ ぱいで....

Dan the Man with Too Many Projects to Manage