Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: EUCでフォーム部分の文字化けについて



寺西です。

SASAKI Yoshiaki wrote:
> 
> 早速ですが、namazu.cgiによる検索の際に、検索式として日本語を入力
> して行うと検索できません。ASCII文字の場合は検索できています。
> また、シェル上でのnamazuコマンドでの検索もできています。

作成したインデックスを使って、
namazu コマンドで日本語の検索および表示はできているということ
ですね?
であれば、インデックスには問題がないということになり、namazu.cgi 
の設定の問題ということでしょう。

> 日本語を入力して行った場合、フォームのテキストフィールドに化けた
> 文字が表示され、実行(submit)ボタンも消えてしまいます。例えば、

この時、IE をお使いなら「表示」「エンコード」が日本語(EUC)に
なっているか確認してください。
もし、なっていないなら、日本語(EUC)を選択すると、表示だけは
正しくなりませんか?

> このページをWindowsのメモ帳で見ると該当部分は
> <input type="text" name="query" size="40" value="裔ニ蚶裔ve「」裔ツ">
> <input type="submit" value="Search!">
> のようになっています。(valueの中のニ、「、」、ツは実際は半角です)

EUC コードのはずですので、メモ帳では文字化けするが当然です。
そういう意味では正しく EUC コードになっているのではないかと
思えます。(この化けた文字が EUC として正しいかどうかまでは確認
していませんけど。)

> 検索実行後のページの他の部分は文字化けしていませんが、検索に失敗
> しているため
>   検索式にマッチする文書はありませんでした。
> というメッセージが表示されます。
> 
> mknmzで作成したNMZ.head.jaは、<head></head>の間に
> <Meta HTTP-EQUIV="content-type"
>         CONTENT="text/html;charset=EUC-JP">
> を加えた以外にカスタマイズはしていません。

ここが気になります。
このカスタマイズした際に漢字コードを EUC-JP で保存しましたか?
別の漢字コードで保存したりしていませんか?
# kcc でチェックしているのなら、問題ないのかもしれませんが。

ここが一番怪しそうに見えます。(kcc が誤認する可能性もあるで
しょうし。)

> 尚、保存している(検索対象の)htmlは、mhonarcでいったんJISで出力
> し、nkf -meでEUCに変換したものです。
> (本当は一度にEUCにしたかったのですがメール本文行頭に ESC+(B が
>   入ってしまうため、まずは強引にこのように作成しました。)

結構特殊な手順を踏んでおられますが、これ自体が問題になって
いることはないでしょう。namazu コマンドで検索できているなら。
 
> kcc というコマンドがあることを知りましたので、念のため上記htmlや
> NMZ.head.ja などは kcc -c でEUCと判定されることは確認しています。

namazu を -h オプション付きで実行すると HTML が出力されます
ので、これをファイルに保存して、kcc でチェックしてみてください。
また、そのファイルを Web ブラウザで開いて文字化けがないか確認して
みてください。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E