[Namazu-devel-ja 1179] mknmz 側の外部エンコーディングの決定方法を変更
Tadamasa Teranishi
yw3t-trns @ asahi-net.or.jp
2006年 8月 28日 (月) 01:13:34 JST
寺西です。
namazu 側に合わせて mknmz 側の外部エンコーディングの決定方法を変更
しました。(HEAD)
また、nkf を用いた from_to の処理で "ISO-2022-JP" が指定できるように
しました。これも namazu に合わせただけのものです。
元のコードはこのようになっていたのですが、修正したものではいくつか
の処理が削除されています。
if ($util::LANG_MSG =~ /utf-8/i) {
$util::EXT_ENCODE = 'utf-8';
} elsif ($util::LANG_MSG =~ /(SJIS|Shift_JIS|shiftjis|Shift-jis)/i) {
$util::EXT_ENCODE = 'shiftjis';
} elsif ($util::LANG_MSG =~ /ISO-2022-JP/i) {
$util::EXT_ENCODE = 'iso-2022-jp';
} elsif (($util::LANG_MSG =~ /ja_JP\.(EUC|ujis|eucJP)/) ||
($util::LANG_MSG eq 'japanese') || ($util::LANG_MSG eq
'ja')){
$util::EXT_ENCODE = 'euc-jp';
} elsif (($util::LANG_MSG =~ /ISO-8859-1/i) ||
($util::LANG_MSG eq 'german') ||
($util::LANG_MSG eq 'de') || ($util::LANG_MSG eq 'deutsch') ||
($util::LANG_MSG eq 'fr') || ($util::LANG_MSG eq 'french') ||
($util::LANG_MSG eq 'es') || ($util::LANG_MSG eq 'spanish')) {
$util::EXT_ENCODE = 'iso-8859-1';
} elsif (($util::LANG_MSG =~ /ISO-8859-2/i) ||
($util::LANG_MSG eq 'polish') || ($util::LANG_MSG eq 'pl')) {
$util::EXT_ENCODE = 'iso-8859-2';
}
・ "utf-8" の代わりに "utf8" を使いました。手元の環境では ja_JP.utf8
だったのと、namazu 側に合わせたためです。
・ "Shift_JIS", "shiftjis", "Shift-jis" "EUC" を削除しました。手元の
環境では、ja_JP.shiftjis 等はなかったためと、namazu 側に合わせた
ためです。
・ "ISO-8859-1" は "ISO-8859-1*" 全てが "ISO-8859-1" となるため、
修正しました。また、"ISO88591" とハイフナなしに対応しました。
手元の環境ではハイフンなしだったためです。
・ "ISO-8859-15" を追加しました。
削除したもので必要そうなものがありましたら、ご指摘ください。
namazu 側と合わせて追加することにします。
--
=====================================================================
寺西 忠勝(TADAMASA TERANISHI) yw3t-trns @ asahi-net.or.jp
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E
Namazu-devel-ja メーリングリストの案内