Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Unicode(UTF-8)文書とUnicode文字検索



岡田と申します。
お蔭様でNamazu-2.0.13を正常動作させることができました。

UTF-8文書とUnicode文字の検索について教えてほしいことがあります。

Namazu-2.0.13では、Unicode(UTF-8)で書かれた日本語文書のうち、
・Shift-JISやEUCにはないUnicode文字を検索することができますか?
・それともUnicodeで書かれた文書のうち、Shift-JISやEUCにある文字のみを検
  索することができ、Shift-JISやEUCにはないUnicode文字は検索できないので
  しょうか?

私がやりたいのは前者で、イメージ的にはGoogleのようなイメージを想定してい
ます。Googleと同じようにしようと思い、NMZ*.jaテンプレートをUnicode(UTF-8)
で保存し、Unicode(UTF-8)で書いた文書のインデックスを作成して検索すると、
検索結果のウェブページはUTF-8で出力されましたが、検索結果のあたりだけが
文字化けしてしまいました。

これは私のインストールや設定がおかしいからなのでしょうか?