Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Unicode(UTF-8) は使えない?



廣瀬さん、小関さん、ご返信ありがとうございます。

書き忘れましたが、私のウェブサイトの環境として、単にプロバイダのスペース
を使っているだけなので、本家Namazuではなく、pNamazuを使っています。また
、ローカルではWindowsを使っています。その前提で書きます。

> SHIFT-JIS にない文字はどうやって入力しているのですか?
> ☼ ☽ のように入力しています?
> 「IMEで入力できるのかなあ」と単純に思ったんです。

検索対象はHTMLページのみで、これらはすべてUTF-8でつくっています。
フォーム送信用のHTMLのみやむなくShift-JISで作成して、ここから検索するよ
うにしています。
以前は、検索対象のHTMLページをShift-JISでつくっていて、その時は小関さん
のおっしゃるようにShift-JISにない文字は、文字参照形式(&#.....;)で書い
ていました。しかし、HTMLページの文字コードをUTF-8にしてからは、文字参照
形式は使わずに、該当する漢字をそのまま使っています。
(ちなみに、文字参照形式をきちんと表示できるブラウザは、Internet
Explorerくらいでした。)
それから、IMEはATOKを使っています。

> 残念ですが、使えません。mknmzで文字コード変換に使っているnkfでは
> unicodeが扱えないためだと思います。
> nkfの代りに ivconvや Jcode.pmを使うようにすればUTF-8でも
> いけるような気がします(が試してません)。

やはりそうですか。残念です。
UTF-8でつくったHTMLページのインデックスは正常につくられるようなのですが
、検索してもまったくヒットしませんでした。
また、フォーム送信用のHTMLページをUTF-8でつくって検索してみたことがあり
ますが、確か検索語がいきなり文字化けしたように思います。