Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: WebDAVサーバの検索



寺西です。

Yukio USUDA wrote:
>  
> 私も今のmknmzの中で言語と文字コードの区別がうまくできていないのが
> 気になっています。
...
> ・表示メッセージの言語
> ・表示メッセージの文字コード
> ・ファイルシステムの文字コード
> ・インデックス対象となる文書ファイルの言語
> ・インデックスの文字コード
> 
> などは別々に管理してあげるとよいのだろうと思います。

難しいです。まだ、きちんと理解できません。
コマンドライン版と CGI 版でまた事情も異なってきそうな気もします。

> > とりあえずサポートするのは SJIS, EUC, HEX, CAP, UTF8 ぐらいで
> > しょうか。(UTF8 は nkf202 以降か、Perl 5.8 以降に限定される
> > でしょう。)
> sambaでファイル共有しているフォルダの文字コードにCAPやHEXが使用
> されていてもファイル名が読めるものにできると便利ですね。

数年前、こういう環境で使っていた時は素直にあきらめていましたが、
ほんの少し修正するだけで対応できそうですから、やってみようかと
思います。
 
> ファイル名での検索も考えるとnamazu側で表示のみ直すより
> mknmz側で処理しておくほうが良いのでしょうね。

ファイル名で検索できませんが...。uri 検索には使えますしね。

と、ここで疑問。${uri} には EUC コードで入っていますが、ファイル名が
半角カタカナが含まれていると、とってもまずいことが起こるような気が
しますが、どうなんでしょう。。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E