Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: charset for encode filename (Re: Re: html-split について )



>これは、全角カナに変えてしまうということでいいのですよね?
win環境ではファイル名はsjis決め打ちでeucに変換してるようです。
半角カナを全角カナに変えます。
codeconv::shiftjis_to_eucjpに相当する関数で
半角カナを半角カナのままにしておく関数を実装すれば対応可能
かもしれませんがそれまでは未対応だと思います。
でも半角カナは文字化けはしません。

>また、$fragment も全角カナにしてしまうということでいいですよね?
$fragmentに半角カナを使ったら多分化けると思います。(codeconv::toeucを使用)
しかし$fragmentが部分があると言うことはおそらくhtmlファイルです。
さすがに$fragment部分に半角カナを使う強者は滅多にいないでしょう。
(こればっかりはわかりませんが:-))
対応しませんと言いきってもあまり問題ないと思います。
大変そうですし。


全角アルファベットが単語として登録される不具合は直っていました。


>また、/c|/tmp/漢字/なまずabc.html の『abc』は URI として保
ちなみに
% namazu +uri:abc
References:  [ +uri:abc: 0 ]
No document matching your query.
となります。
仕様でしょうが一応報告します。