[Namazu-devel-ja 1179] mknmz 側の外部エンコーディングの決定方法を変更

Tadamasa Teranishi yw3t-trns @ asahi-net.or.jp
2006年 8月 28日 (月) 01:13:34 JST


寺西です。

namazu 側に合わせて mknmz 側の外部エンコーディングの決定方法を変更
しました。(HEAD)
また、nkf を用いた from_to の処理で "ISO-2022-JP" が指定できるように
しました。これも namazu に合わせただけのものです。

元のコードはこのようになっていたのですが、修正したものではいくつか
の処理が削除されています。

  if ($util::LANG_MSG =~ /utf-8/i) {
      $util::EXT_ENCODE = 'utf-8';
  } elsif ($util::LANG_MSG =~ /(SJIS|Shift_JIS|shiftjis|Shift-jis)/i) {
      $util::EXT_ENCODE = 'shiftjis';
  } elsif ($util::LANG_MSG =~ /ISO-2022-JP/i) {
      $util::EXT_ENCODE = 'iso-2022-jp';
  } elsif (($util::LANG_MSG =~ /ja_JP\.(EUC|ujis|eucJP)/) ||
           ($util::LANG_MSG eq 'japanese') || ($util::LANG_MSG eq
'ja')){
      $util::EXT_ENCODE = 'euc-jp';
  } elsif (($util::LANG_MSG =~ /ISO-8859-1/i) ||
          ($util::LANG_MSG eq 'german') ||
          ($util::LANG_MSG eq 'de') || ($util::LANG_MSG eq 'deutsch') ||
          ($util::LANG_MSG eq 'fr') || ($util::LANG_MSG eq 'french')  ||
          ($util::LANG_MSG eq 'es') || ($util::LANG_MSG eq 'spanish')) {
      $util::EXT_ENCODE = 'iso-8859-1';
  } elsif (($util::LANG_MSG =~ /ISO-8859-2/i) ||
          ($util::LANG_MSG eq 'polish') || ($util::LANG_MSG eq 'pl')) {
      $util::EXT_ENCODE = 'iso-8859-2';
  }

・ "utf-8" の代わりに "utf8" を使いました。手元の環境では ja_JP.utf8 
   だったのと、namazu 側に合わせたためです。
・ "Shift_JIS", "shiftjis", "Shift-jis" "EUC" を削除しました。手元の
   環境では、ja_JP.shiftjis 等はなかったためと、namazu 側に合わせた
   ためです。
・ "ISO-8859-1" は "ISO-8859-1*" 全てが "ISO-8859-1" となるため、
   修正しました。また、"ISO88591" とハイフナなしに対応しました。
   手元の環境ではハイフンなしだったためです。
・ "ISO-8859-15" を追加しました。

削除したもので必要そうなものがありましたら、ご指摘ください。
namazu 側と合わせて追加することにします。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns @ asahi-net.or.jp
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E




Namazu-devel-ja メーリングリストの案内