[Namazu-users-ja 803] Re: namazuでの検索結果(日本語)でURIの所だけ文字化け

Tadamasa Teranishi yw3t-trns @ asahi-net.or.jp
2006年 7月 3日 (月) 23:36:08 JST


寺西です。

そう言えば...

> ■mod_encoding
>  SetServerEncoding     EUC-JP
>  DefaultClientEncoding JA-AUTO-SJIS-MS SJIS
>  AddClientEncoding "cadaver/" EUC-JP

と mod_encoding を使っていますね。

http://www.aconus.com/~oyaji/faq/apache_encoding.htm

にあるように、mod_encoding を使うと CGI の GET Method の文字が
文字化けを起こすといったことが起こります。
# 少なくとも昔はそうでした。今はどうなのか知りませんが...。

これはクライアントから Apache が受け取った後、漢字コード変換して、
CGI に渡すからです。

症状的から想像するに、自動変換する際のコードの誤認により間違った
変換を行うことがあったのではないかと思われます。そのケースが
「テスト」なのではないかと。

対策用のパッチもあったかと思いますが、必要なければ mod_encoding 
を使わないというのが良いのではないでしょうか。

Tadamasa Teranishi wrote:
> 
> では、もう一度 「テスト」で検索して、Web サーバのログ access_log
> の先頭部分と NMZ.slog の先頭部分を確認しましょう。
> 文字化けの理由がわかるかもしれません。

これを確認すると、access_log か、少なくとも NMZ.slog には化けたもの
が記録されているのではないかと思います。

あと、httpd.conf に

  AddDefaultCharset ISO-8859-1

があれば、コメントアウトしておくというのも(本件には関係ないかも
しれないが)文字化けを解消する方法のひとつです。

あるいは、.namazurc に以下の内容を書くかです。(UNIXの場合)

ContentType    "text/html; charset=EUC-JP"
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns @ asahi-net.or.jp
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E




Namazu-users-ja メーリングリストの案内