Namazu-win32-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

RE: 日本語ファイル名 PDF 文書のリンクについて



竹迫です。

Ryuuichi Nagai <r-nagai@xxxxxxxxxxxxxxxxxxx> wrote:
>こちらのMLを参考に、なんとか日本語ファイル名PDF文書の
>インデックス作成(pdftotext使用)、ブラウザ(IE5.01SP2)からの検索、
>日本語ファイル名のまま結果表示までできるようになりました。
>
>しかし肝心なリンクが利いてません。
>---以下Apacheのエラー表示-----------------------------------------------
>Forbidden
>You don't have permission to access /namazu/example/文字化け......PDF on
>this server
>------------------------------------------------------------------------
>ちなみに同じ条件のExcel、Wordのファイルは問題なくリンクされます。

こちらから一つお伺いしたいのですが、Excel、Word のファイル名にも
同一の日本語が含まれているのでしょうか? また、IE5.01SP2以外のブ
ラウザ(例:Netscape 4.75 など)ではアクセスできるのでしょうか?

お使いになっているブラウザが IE5以降だと、デフォルトの設定では、
日本語を含んだ URL を Shift_JIS ではなく UTF-8 でエンコードして
送信してしまうので、対象ファイルにうまくアクセスできないのでは
ないかと思います。

まずは、IE5 のブラウザの設定を [ツール] -> [インターネットオプション] 
-> [詳細設定] の中にある [いつも UTF-8 として URL を送信する] の
チェックをオフにしてから、もう一度試してみていただけないでしょうか?

・[IE5]URL やファイル名に日本語が使用されていると表示できない件
  http://www.microsoft.com/japan/support/kb/articles/j047/3/01.htm

・[namazu-win32-users-ja] Re:日本語含みのURLについて
  http://www.namazu.org/ml/namazu-win32-users-ja/msg00475.html

・[namazu-win32-users-ja] Re: 漢字名ファイルの表示対策(for IE5)
  http://www.namazu.org/ml/namazu-win32-users-ja/msg00249.html

すべての利用者に対してこの設定を徹底するのが難しい場合は、URL中に 
UTF-8 が含まれていても処理できる Webサーバ(IIS 4.0 or IIS 5.0 or 
AN HTTPD の最新版など)に乗り換えてしまうというのも手かもしれません。

# ちなみに、会社では Windows NT4.0SP6a + IIS 4.0 + kakasi 2.3.3 +
# Namazu 2.0.5 for Win32 半角カナ対応パッチの環境で運用しています。

あと、Apache のエラーメッセージが Not Found ではなくって、
Forbidden - You don't have permission to access となっている
のも気になりますね。上記の対処方法でうまくいかなかった場合は、
問題のPDFファイルに対して読み込み権限がきちんと与えられている
かどうかを確認してみて下さい。

--
  広島市立大学 情報科学部 情報機械システム工学科 知能ロボット講座
    竹迫 良範 <takesako@xxxxxxxxxxxxxxxxxxxxxxxxxxxxxx>