[Namazu-devel-ja 1750] pl/extutf8.pl を追加
Tadamasa Teranishi
yw3t-trns @ asahi-net.or.jp
2008年 7月 14日 (月) 02:52:34 JST
寺西です。
pl/extutf8.pl を追加しました。
UTF-8 拡張機能
- UTF-8 から EUC-JP への変換
NKF perl モジュール、Encode、lv、unicode.pl のいずれかが必要
- UTF-8 から US-ASCII への変換
US-ASCII 以外の文字は '#' に置き換え
- UTF-8 から EUC-JP または US-ASCII への変換後、テキストの正規化
を行います。
まだ、フィルタから呼び出していませんが、フィルタ内にある UTF-8 から
EUC-JP への変換処理を共通化して外部に押し出すことが目的です。
--
=====================================================================
寺西 忠勝(TADAMASA TERANISHI) yw3t-trns @ asahi-net.or.jp
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E
Namazu-devel-ja メーリングリストの案内