Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: EUCでフォーム部分の文字化けについて



寺西です。

SASAKI Yoshiaki wrote:
> 
> > 「Namazu による全文検索システム」、「インデックスの最終更新日:」
> > といった NMZ.head.ja 部分の文字列も壊れているのですよね?
> 
> いえ、これらの部分は壊れていません。"テスト投稿です"と入力して

あぁそうでしたか。
では、かなり入力した文字列の漢字コードの問題ぽいですね。
# NMZ.head.ja は大丈夫そうです。

> > IE 6 をお使いなら、「ツール」「インターネットオプション」「詳細設定」
> > 「常に UTF-8 として URL を送信」がチェックされているのではないか
> > と思います。
...
> WebブラウザはIE6を使って検証しています。
> 
> 見落としていました。こういったオプションがあるんですね。
> ですが、残念ながら、チェックをはずしてOSごと再起動しても文字化けは
> 解消できませんでした。(このままチェックをはずしたまま検証続けます)

そうですか。
実は、手元の IE6 でチェックが入っていても大丈夫でした。

で、実際にどういう漢字コードが送られるか調べてみたところ、
eucJP のページに対しては eucJP で送られるようです。(検索可能)

また、utf-8 のページに対しては utf-8 で送られるようで、この
場合は検索できませんでした。(検索文字列が文字化けします。症状と
しては近い結果です。)

どこに問題があるのか切り分けが難しいので、まずは Web ブラウザから
どのような文字列が送られているのか確認していただけますか?

1. 入力した検索文字列
2. 文字化けしたページの URL 
  例)
http://www.namazu.org/cgi-bin/namazu.cgi?query=%E6%BC%A2%E5%AD%97&whence=0&max=20&result=normal&sort=score
3. /var/log/httpd/access_log (パスは異なるかもしれません)に記録
 されている GET の情報
   例) xxx.xxx.xxx.xxx - - [22/Jan/2004:19:28:28 +0900] "GET
/cgi-bin/namazu.cgi?query=%E6%BC%A2%E5%AD%97&whence=0&max=20&result=normal&sort=score
HTTP/1.1" 200 5369

ここで eucJP, ShiftJIS コード(URI エンコードされている)なら、
Web ブラウザ側は大丈夫でしょう。
 
> また、先程WebサーバのコンソールからXを立上げ、モジラで試してきま
> したが、やはり文字化けしました。

むむむ。モジラからもダメとなると、送られてきた検索文字列を
Apache が何か加工していそうな気もします。

何か変わったモジュールを入れていますか? (WebDAV 関係とか)

> > nkf のバージョンを上げましょう。そうすればチェックが入っていても
> > 大丈夫になると思います。
> 
> いずれにしてもnkfのバージョンを2.0.4 に上げたいと思います。

失礼。namazu.cgi は NKF を使っていませんでした。(使っているのは
mknmz の方)
ゆえに NKF のバージョンを変えても、結果は変わらないかもしれません。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E