Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: WebDAVサーバの検索



寺西です。

Tadamasa Teranishi wrote:
> 
> 自動認識ではまずいとなると、WebDAV サーバであるか否か
> あるいはファイル名の漢字コードが何であるかを mknmz が自動認識
> またはユーザによる指定が必要ということになりますね。
> 
> てっとり早くやるには $util::LANG_MSG が ja_JP.utf8 なら
> utf8toeuc を通す。ja_JP.SJIS なら shiftjis_to_eucjp を
> 通すということで良いのかもしれません。

と書きましたが、出力したい漢字コードと、ファイル名の漢字コードが
別ということもありえるし、区別できた方が何かと便利だと思い直し
ました。

また、

> 横道にそれますが、更に CAP でエンコードされたファイル名も
> ここでデコードすると幸せになる人がいるかもしれませんね。
> (これの指定方法はどうする? という話はありますが...。)

ということも考えると Samba の codingsystem パラメータを .mknmz に
追加するというのが良いのかもしれません。
(namazu-devel-ja#00574 で野首さんもちらっと言っている)

とりあえずサポートするのは SJIS, EUC, HEX, CAP, UTF8 ぐらいで
しょうか。(UTF8 は nkf202 以降か、Perl 5.8 以降に限定される
でしょう。)

デフォルトは $mknmz::SYSTEM が "MSWin32" か "os2" の時は SJIS で
それ以外は EUC として、必要に応じて書き換えてもらうということで、
よろしいかと思います。

ちなみに、
ちょっと調べたところ、namazu-users-ja#00862 に CAP で困っている
人がいました。
Samba がらみだと namazu-users-ja#00676 もこの関連の話で、こちらは
テンプレートの修正についての話があります。
あまり話題にのぼりませんが、UNIX で SHIFT_JIS を使っている人
(HP-UX はデフォルトは SHIFT_JIS だし)も困っているのではないかと
思ったりします。

ということで、結構みんな困ってるんでは?

修正箇所が多いので、次期リリースで対応するか、2.1系で対応したい
と思います。
# 早くリリースしたいし。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E