[Namazu-users-ja 803] Re: namazuでの検索結果(日本語)でURIの所だけ文字化け
Tadamasa Teranishi
yw3t-trns @ asahi-net.or.jp
2006年 7月 3日 (月) 23:36:08 JST
寺西です。
そう言えば...
> ■mod_encoding
> SetServerEncoding EUC-JP
> DefaultClientEncoding JA-AUTO-SJIS-MS SJIS
> AddClientEncoding "cadaver/" EUC-JP
と mod_encoding を使っていますね。
http://www.aconus.com/~oyaji/faq/apache_encoding.htm
にあるように、mod_encoding を使うと CGI の GET Method の文字が
文字化けを起こすといったことが起こります。
# 少なくとも昔はそうでした。今はどうなのか知りませんが...。
これはクライアントから Apache が受け取った後、漢字コード変換して、
CGI に渡すからです。
症状的から想像するに、自動変換する際のコードの誤認により間違った
変換を行うことがあったのではないかと思われます。そのケースが
「テスト」なのではないかと。
対策用のパッチもあったかと思いますが、必要なければ mod_encoding
を使わないというのが良いのではないでしょうか。
Tadamasa Teranishi wrote:
>
> では、もう一度 「テスト」で検索して、Web サーバのログ access_log
> の先頭部分と NMZ.slog の先頭部分を確認しましょう。
> 文字化けの理由がわかるかもしれません。
これを確認すると、access_log か、少なくとも NMZ.slog には化けたもの
が記録されているのではないかと思います。
あと、httpd.conf に
AddDefaultCharset ISO-8859-1
があれば、コメントアウトしておくというのも(本件には関係ないかも
しれないが)文字化けを解消する方法のひとつです。
あるいは、.namazurc に以下の内容を書くかです。(UNIXの場合)
ContentType "text/html; charset=EUC-JP"
--
=====================================================================
寺西 忠勝(TADAMASA TERANISHI) yw3t-trns @ asahi-net.or.jp
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E
Namazu-users-ja メーリングリストの案内