Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: zipフィルタ Re: lha フィルタ



寺西です。

Yukio USUDA wrote:
>
> cygwinで作成したものはunx, +lhaca で作成したものは ntf になっていました。
> ここで判別していたのですね。

はい。
 
> unzipの不具合ということですか。

日本語のファイル名を考慮していないということですね。

MSDOS で作られた .zip で、8bit 文字は iso8859-1 とみなし、UNIX 端末
に表示する際に不具合がでないように、わざわざコード変換するという
仕様のようです。
 
> 関連情報がないかと検索していたところ
> OS X で作成された .zip ファイルはファイル名が
> utf-8で入っているというような記述を見かけました。

zip ファイルを作成した環境の CodingSystem に依存するので、utf-8 
になっているのは、ごく普通かと思います。
(UNIX で作れば EUC-JP になりますし。)

toeuc() で変換すれば問題はないでしょう。(nkf2.0.4 以降が必要)

> > あるいは、Perl モジュール必須にするかですね。
> > --
> Archive::ZIPだとうまくいくのですかね。

zip ファイル自体には、正しいファイル名が含まれていますので、
そのまま取り出すことが可能だろうと思います。

unzip がコード変換を行うのは、UNIX 端末に表示するために行っている
余計な処理ですので、それが含まれていることはおそらくないでしょう。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E