Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [RFC]${uri}の拡張



寺西です。

Kenji Suzuki wrote:
> 
> > > これですが、サーバの漢字コードというのはどうやってわかるんで
> > > しょうか?
> >
> > .namazurc で指定するという案が出ています。
> 
> 複数の漢字コードの異なるインデックスをまとめて検索する場合は、
> インデックス毎に指定でしょうか。
> 
> ひとつのインデックスに複数の漢字コードが存在する場合は、どう
> するのでしょうか?

サーバの漢字コードは統一しているものとしています。
ここの漢字コードとは、ファイル名の漢字コードのことです。

漢字コードの異なるファイル名が混在する可能性はありますが、
システムを構築する際にファイル名の漢字コードを統一することは
可能だろうと考えています。

いいかえれば、Web サーバのファイル名の漢字コードは統一されて
いるのが普通で、複数の漢字コードのファイル名を使用するのは
特殊な環境だろうと仮定しています。
(何らかのミスで複数の漢字コードのファイル名を使っているので
あれば、設定を変更してもらう。意図があって複数の漢字コード
を使っているのであれば、それは特殊な環境とみなせる。)

もし、複数の漢字コードのファイル名を使用するのであれば、
漢字コードの異なるファイル名ごとにインデックスを分けて作ると
いう方法もあるでしょう。

より頻度が高いのであれば、ディレクトリごとに漢字コードを指定できる
ような仕様にすることも可能でしょう。(そこまでは必要ないかなと
思ってサーバのファイル名の漢字コードは統一としています。)

例えば、Apache の形式に似た形で設定するとかです。
同じディレクトリに複数の漢字コードのファイル名が含まれている
可能性もないわけではありませんが、これはかなり特殊な環境です
ので、そこまでは対応できなくても良いかと思っています。
同様にディレクトリ名とファイル名の漢字コードが異なっている可能性
もあるのですが、それも対応しなくても良いだろうと思っています。
# なぜなら、Namazu 以外でもそのようなファイルにアクセスするのは
# 支障がでる可能性が高いためです。

<Directory /home/>
CodeSystem eucJP
</Directory> 

仕様変更については Namazu 2.1系で対応ということになるで
しょうけど。

ちなみに複数の漢字コードのファイル名が混在するケースとして、
どういった場合を考えられているのでしょうか?
想定しているものに漏れがあって、致命的な欠点があるなら、対応を考え
直します。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E