[Namazu-users-ja 275] Re: Macで日本語のファイルを検索させたい。

Tadamasa Teranishi yw3t-trns @ asahi-net.or.jp
2005年 2月 2日 (水) 11:15:01 JST


寺西です。

jun-krb wrote:
> 
> 結果ですが、芳しくありません。
> ファイル名に濁音、半濁音が含まれていると、NMZ.r, NMZ.field.uriに書かれた
> ファイルの濁音、半濁音部分が文字化けし、URIが正しく作られません。

あまり考えられないことが起こっているような...。
EUC-JP のファイル名で濁音、半濁音があっても文字化けはしませんから、
UTF-8 から EUC-JP への変換にまずいところがあるのではないかと
思ったりします。

> 例えば
> ダ が タ + □ になります。

これは 「ダ」ではなくて「タ」「゛」が「タ」「□」になったということ
でしょうか?
 
> 中間で生成されるNMZ.flist.tmpにあるファイル名は文字化けしていません。
> NMZ.flistを読み込んだ直後に文字列 $line をPrintすると、文字化けしています。

具体的にはどこでしょう。

また、元ファイル名は何で、その16進数での値はどのようなものだったので
しょう。それを EUC-JP に変換して、NMZ.flist.tmp にあるファイル名
は、16進でどのような値になっているのでしょう。
化けた時は、16進ではどのような値になっているのでしょう。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns @ asahi-net.or.jp
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E



Namazu-users-ja メーリングリストの案内