Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

検索結果の文字化け



こんにちは。平田と申します。
検索結果の文字化けについて教えてもらえればと思い投稿しました。
RedHat6.1Jにnamazu2.0.5をインストール、mknmzでインディックスを作成、
namazu.cgiを設置しました。検索対象はメールで、EUCコードとSJISコードのテ
キストファイルが混在しています。

遭遇している問題は、namazu.cgiで検索を行い、検索にヒットしたメールがSJIS
コード、EUCコードが混在しているとSJISコードのメールのタイトル、本文が文
字化けすることがあるということです。
検索キーによっては文字コードが混在していても文字化けしないこともありますが。

namazuサイト(http://www.namazu.org/events/lc2000s/handout.html#library)
で、次の記述を発見しました。
--
しかし、一点だけ要求にそぐわないところがありました。それは、インデックス
対象の文章がEUCで書かれていることを前提にしていた点です。
--

実際、EUCコードとSJISコードで書かれたファイルが混在するシステムでnamazu
検索を行う場合にはインデックス対象の文章をEUCに統一する必要があるでしょ
うか?それとも、検索結果の表示の問題で文字コード統一以外で対処方法がある
のでしょうか?

初歩的な質問だとは思いますが。ご教示お願いします。
--
平田由佳
hirata@xxxxxxxxxxxxxx