[Namazu-users-ja 772] Re: namazuでの検索結果(日本語)でURIの所だけ文字化け

Tadamasa Teranishi yw3t-trns @ asahi-net.or.jp
2006年 6月 28日 (水) 14:11:16 JST


寺西です。

望月 敦盛 wrote:
> 
> いろいろと調べましたが、結局分からなかったため、投稿いたします。
> 何が出来ないかと申しますと、namazuでの検索結果(日本語)でURIの所だけ文字化
> けします。

URIが文字化けするということはファイル名、ディレクトリ名に漢字が
含まれるのだろうと思いますが、漢字のサポートはおまけ程度だという
ことに注意してください。

> ■使用ソフト
> os RedHat EnterpriseLinux ES ver3
> namazu2.0.16
> nkf2.0.4

nkf は 2.0.6 以降をご使用ください。できれば Perl モジュールも
インストールするのが良いでしょう。

> ■namazuの設定ファイル(文字に関係しそうな部分)
> .namazurc Lang ja(他にja_JP.SJISとja_JP.eucJP,ja_JP.UTF8試しました)

ja_JP.SJIS, ja_JP.UTF8 は UNIX 系OS では指定してはなりません。
UNIX 系 OS では ja_JP.eucJP を指定してください。

>  .mknmrc $NKF = "/usr/bin/nkf";
> $KAKASI = "/usr/local/bin/kakasi -isjis -oeuc -w";
> (isjisの部分をieucに変更しても特に変化なし)

ここのオプションは書き換えてはいけません。

$KAKASI = "/usr/local/bin/kakasi -ieuc -oeuc -w";

> ■シェルでLANG=ja ;export LANGとしました。
> (他にja_JP.SJISとja_JP.eucJP,ja_JP.UTF8試しました)

ja_JP.SJIS, ja_JP.UTF8 は UNIX 系OS では指定してはなりません。
UNIX 系 OS では ja_JP.eucJP を指定してください。
 
> 検索を掛けたいファイルはWindowsで作りSAMBAの3.0.7でサーバーに送った物です。

ファイル名、ディレクトリ名に漢字が含まれているわけですが、SAMBA 上で
のファイル名、ディレクトリ名の漢字コードは何になっているでしょう。

> ■インデックス作成のコマンドには-Uのオプションを付加しています。

この場合、-U オプションは付けないでください。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns @ asahi-net.or.jp
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E




Namazu-users-ja メーリングリストの案内