Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: WordやExcelのファイル名の文字化け表示



寺西です。

SAIJI_Mitsuhiro wrote:
> 
> /common1/docs/というフォルダに「文書.doc」をいれて、
> http://xxx.xxx.xxx.xxx/common1/docs/%95%b6%8f%91.doc
> にアクセスしても、
> HTTP 404 - ファイル未検出
> Internet Explorer
> がでます。

それでは、ファイル名が SJIS になっていないでしょう。
 
> そこで、「文書.doc」のインデックスを作成すると、
> URIエンコードの結果は
> http://xxx.xxx.xxx.xxx/common1/docs/%CA%B8%BD%F1.doc
> となり、

「文書」の EUC コードは CAB8 BDF1 です。つまりファイル名は EUC 
コードになっているということですね。

そうであれば、EUC コードのファイル名のものを Word なり
Excel なりで開いても、名前を付けて保存する際に Shift_JIS に
変換して表示したりはどうやってもできないでしょう。
(Word や Excel にそんな機能はないはず)

名前を付けて保存する際に文字化けせずに表示するには、
ファイル名が Shift_JIS でなければならないはずです。
(Unicode も可能かもしれません。)

ここまでは、Namazu と全く関係のない話です。では、ファイル名を 
Shift_JIS にすれば Namazu も期待したとおりに動くかというと、

> もし、文字化けがエンコードされたままだということが問題なので
> あれば、mknmz 実行時に -U オプションを付けて、URI のエンコードを
> 行わないようにすれば、うまくいくような気がします。
> と、思いましたが UNIX では Shift_JIS のファイル名はうまく扱えない
> かもしれません。

という話があって、Namazu では UNIX 版は Shift_JIS のファイル名は
うまく扱えないという別の話があります。
(正確には UNIX 版はファイル名は EUC-JP であることが前提で、
Win32 版はそれを Shift_JIS であることが前提に変更したわけですが。) 

つまり、今のところ期待した動作をする環境を作るには、Web サーバを
Windows 系のものに変えて、Win32 版 Namazu を使うと可能かもしれません。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E