[Namazu-users-ja 771] namazuでの検索結果(日本語)でURIの所だけ文字化け

望月 敦盛 a_mochizuki @ hithit.co.jp
2006年 6月 28日 (水) 13:16:36 JST


いろいろと調べましたが、結局分からなかったため、投稿いたします。
何が出来ないかと申しますと、namazuでの検索結果(日本語)でURIの所だけ文字化
けします。
検索結果のタイトルがUTF-8で要約のところがEUCです。
  (ブラウザのエンコードを日本語EUCとUTF-8で試しました)

どこを変えればよいのかサッパリ解りませんので皆さんのお知恵をお借りしたく思い
ます。

■使用ソフト
os RedHat EnterpriseLinux ES ver3
namazu2.0.16
nkf2.0.4
kakasi2.3.4
を使用しております。

■mknmz -Cの結果(一部)

システム: linux
Namazu: 2.0.16
Perl: 5.008000
File-MMagic: 1.25
NKF: /usr/bin/nkf
KAKASI: /usr/local/bin/kakasi -ieuc -oeuc -w
茶筌: no
和布蕪: no
わかち書き: /usr/local/bin/kakasi -ieuc -oeuc -w
メッセージの言語: ja_JP.eucJP
言語: ja_JP.eucJP
文字コード: euc

■namazuの設定ファイル(文字に関係しそうな部分)
.namazurc Lang ja(他にja_JP.SJISとja_JP.eucJP,ja_JP.UTF8試しました)

 .mknmrc $NKF = "/usr/bin/nkf";
$KAKASI = "/usr/local/bin/kakasi -isjis -oeuc -w";
(isjisの部分をieucに変更しても特に変化なし)

■シェルでLANG=ja ;export LANGとしました。
(他にja_JP.SJISとja_JP.eucJP,ja_JP.UTF8試しました)

検索を掛けたいファイルはWindowsで作りSAMBAの3.0.7でサーバーに送った物です。

■インデックス作成のコマンドには-Uのオプションを付加しています。
mknmz -kU --replace='s#/home/XXXX/YYYY##;'
--config='/var/www/cgi-bin/.mknmzrc' -O /usr/local/var/namazu/index
/home/XXXX/YYYY

■mod_encoding
 SetServerEncoding     EUC-JP
 DefaultClientEncoding JA-AUTO-SJIS-MS SJIS
 AddClientEncoding "cadaver/" EUC-JP

■作成されたインデックスのファイル
NMZ.field.subject
NMZ.field.uri
をPCにダウンロードし、サクラエディタを用いて
EUCで保存しなおし、アップロードしたところ、
文字化けが解消されたため、このファイルが文字化けの原因ようです。

不足な情報があるかも知れませんが以上よろしくお願いします。

--
No virus found in this outgoing message.
Checked by AVG Free Edition.
Version: 7.1.394 / Virus Database: 268.9.5/377 - Release Date: 2006/06/27





Namazu-users-ja メーリングリストの案内