Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: WebDAVサーバの検索



臼田です

Tadamasa Teranishi wrote:
> 
> と書きましたが、出力したい漢字コードと、ファイル名の漢字コードが
> 別ということもありえるし、区別できた方が何かと便利だと思い直し
> ました。

私も今のmknmzの中で言語と文字コードの区別がうまくできていないのが
気になっています。
(--index-langオプションがついてからは環境変数LANGに依存しなくなり
使いやすくなったのですが)

・表示メッセージの言語
・表示メッセージの文字コード
・ファイルシステムの文字コード
・インデックス対象となる文書ファイルの言語
・インデックスの文字コード

などは別々に管理してあげるとよいのだろうと思います。

> > 横道にそれますが、更に CAP でエンコードされたファイル名も
> > ここでデコードすると幸せになる人がいるかもしれませんね。
> > (これの指定方法はどうする? という話はありますが...。)
> ということも考えると Samba の codingsystem パラメータを .mknmz に
> 追加するというのが良いのかもしれません。
> (namazu-devel-ja#00574 で野首さんもちらっと言っている)
> 
> とりあえずサポートするのは SJIS, EUC, HEX, CAP, UTF8 ぐらいで
> しょうか。(UTF8 は nkf202 以降か、Perl 5.8 以降に限定される
> でしょう。)
sambaでファイル共有しているフォルダの文字コードにCAPやHEXが使用
されていてもファイル名が読めるものにできると便利ですね。


> デフォルトは $mknmz::SYSTEM が "MSWin32" か "os2" の時は SJIS で
> それ以外は EUC として、必要に応じて書き換えてもらうということで、
> よろしいかと思います。
> ちなみに、
> ちょっと調べたところ、namazu-users-ja#00862 に CAP で困っている
> 人がいました。
> Samba がらみだと namazu-users-ja#00676 もこの関連の話で、こちらは
> テンプレートの修正についての話があります。
ファイル名での検索も考えるとnamazu側で表示のみ直すより
mknmz側で処理しておくほうが良いのでしょうね。

臼田幸生