[Namazu-users-ja 773] Re: namazuでの検索結果(日本語)でURIの所だけ文字化け

Masanori NAKASHIMA nakasima @ catv.ad.jp
2006年 6月 28日 (水) 17:31:54 JST


中島です。

まと外れかもしれませんが、以下の対応でどうでしょうか。
※以前当 ML で投稿。

---------- ここから ---------- ここから ----------
石川です。

この対処方法が有効ではないでしょうか?
↓↓↓
http://www.namazu.org/ml/namazu-users-ja/msg00675.html

うちはSolaris 8+Namazu v2.0.10+Samba 2.2.2-ja-1.1と上記の方法で
とりあえずうまく稼動しています。


Masanori Nakashima wrote:

> はじめまして中島です。
>
> (質問内容)
> 以下の環境においてnamazu検索結果のURL表示の日本語部分
> がコードになってしまいます。
> 日本語表示できないのでしょうか。
>
> - サンプル -
> http://192.168.51.30/GRPSVR2/docmaster/%A5%BB%A5%F3%A5%BF%A1%BC%B5%A1%B4%EF/
> DOCSIS/%A5%CF%A1%BC%A5%C9%BB%F1%CE%C1/uBR10012MC520%B0%DC%C0%DF%BA%EE%B6%C8/
> %A5%CE%A1%BC%A5%C9%CA%D1%B9%B9.xls
>
> %〜の部分は日本語です。
>
> (環境)
> OS:Linux(RedHat9)
> カーネルバージョン:2.4.22
> Namazuバージョン:2.0.12
>
> ドキュメント対象はWindowsのファイルでSambaを使用(smbfs)を使用して
> unixにマウントしています。
>
> マウントコマンドは
> /bin/mount -t smbfs -o username=xxxxxxxx,password=xxxxxxxx,codepage=cp932,iochar
> set=euc-jp //????/???? /????/????/????
> です。
>
> アドバイスお願い致します。

--
 伊藤忠テクノサイエンス株式会社
 製造営業本部
 製造システム技術部
 テクニカルソリューション1グループ

 石川宗継
 munetsugu.ishikawa @ ctc-g.co.jp
 tel:03-5728-7587
 fax:03-5728-7579
---------- ここまで ---------- ここまで ----------

On Wed, 28 Jun 2006 13:16:36 +0900
望月 敦盛 <a_mochizuki @ hithit.co.jp> wrote:

> いろいろと調べましたが、結局分からなかったため、投稿いたします。
> 何が出来ないかと申しますと、namazuでの検索結果(日本語)でURIの所だけ文字化
> けします。
> 検索結果のタイトルがUTF-8で要約のところがEUCです。
>   (ブラウザのエンコードを日本語EUCとUTF-8で試しました)
> 
> どこを変えればよいのかサッパリ解りませんので皆さんのお知恵をお借りしたく思い
> ます。
> 
> ■使用ソフト
> os RedHat EnterpriseLinux ES ver3
> namazu2.0.16
> nkf2.0.4
> kakasi2.3.4
> を使用しております。
> 
> ■mknmz -Cの結果(一部)
> 
> システム: linux
> Namazu: 2.0.16
> Perl: 5.008000
> File-MMagic: 1.25
> NKF: /usr/bin/nkf
> KAKASI: /usr/local/bin/kakasi -ieuc -oeuc -w
> 茶筌: no
> 和布蕪: no
> わかち書き: /usr/local/bin/kakasi -ieuc -oeuc -w
> メッセージの言語: ja_JP.eucJP
> 言語: ja_JP.eucJP
> 文字コード: euc
> 
> ■namazuの設定ファイル(文字に関係しそうな部分)
> .namazurc Lang ja(他にja_JP.SJISとja_JP.eucJP,ja_JP.UTF8試しました)
> 
>  .mknmrc $NKF = "/usr/bin/nkf";
> $KAKASI = "/usr/local/bin/kakasi -isjis -oeuc -w";
> (isjisの部分をieucに変更しても特に変化なし)
> 
> ■シェルでLANG=ja ;export LANGとしました。
> (他にja_JP.SJISとja_JP.eucJP,ja_JP.UTF8試しました)
> 
> 検索を掛けたいファイルはWindowsで作りSAMBAの3.0.7でサーバーに送った物です。
> 
> ■インデックス作成のコマンドには-Uのオプションを付加しています。
> mknmz -kU --replace='s#/home/XXXX/YYYY##;'
> --config='/var/www/cgi-bin/.mknmzrc' -O /usr/local/var/namazu/index
> /home/XXXX/YYYY
> 
> ■mod_encoding
>  SetServerEncoding     EUC-JP
>  DefaultClientEncoding JA-AUTO-SJIS-MS SJIS
>  AddClientEncoding "cadaver/" EUC-JP
> 
> ■作成されたインデックスのファイル
> NMZ.field.subject
> NMZ.field.uri
> をPCにダウンロードし、サクラエディタを用いて
> EUCで保存しなおし、アップロードしたところ、
> 文字化けが解消されたため、このファイルが文字化けの原因ようです。
> 
> 不足な情報があるかも知れませんが以上よろしくお願いします。
> 
> --
> No virus found in this outgoing message.
> Checked by AVG Free Edition.
> Version: 7.1.394 / Virus Database: 268.9.5/377 - Release Date: 2006/06/27
> 
> 
> _______________________________________________
> Namazu-users-ja mailing list
> Namazu-users-ja @ namazu.org
> http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja

--------------------------------------------------
※部署が変わりました。
--------------------------------------------------
マイ・テレビ株式会社 技術部 中島 政則
〒190-8539 東京都立川市栄町6-1-1 立飛ビル6号館別館
TEL : 042-538-0766,  FAX : 042-538-0860
E-MAIL : nakasima @ catv.ad.jp
URL : http://www.mytv.co.jp/




Namazu-users-ja メーリングリストの案内