Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: (doc/*/tutorial,File-MMagic-1.20 ) Re: nkf-1.7 ->..



寺西です。

Rei FURUKAWA wrote:
> 
> 現状で -Z3 を使うには、
>     改造する
>     html しか扱わない
> のどちらかが条件になります

よく考えてみると、mknmz で漢字コードの変換をするのは、基本的には
pre_codeconv か post_codeconv ぐらいですね。
そして、-Z3 を付けて変換するのなら、$mtype が text/html の
時だけでとりあえずは十分なはずです。

ですので、text/html の時だけ、pre_codeconv をやめて、html_filter
内でコード変換を行えば良いように思います。
(html::escape_lt_gt 呼び出し直前辺り)
比較的改造は簡単ですね。

こうすることで、NKF 以外で変換されたHTML(フィルタによって EUC 出力
されたものとか、lv で変換されたもの)を html_filter で直接呼び出された
場合であっても、-Z3 の処理を加えることができますね。
(現状では html_filter を直接呼び出すと NKF の処理は通らない)

そして、2.02 の -Z3 だけではなくて、1.71 でも -Z3 に相当する変換
ルーチン(-Z1 も指定しなくて、-Z1, -Z3 に相当する処理を後で行う)を
Namazu 側で用意すれば、NKF のバージョンチェックも不要になって、とても
すっきりするような気がします。
 
> codeconv.pl の toeuc には、$opt という引数があるのですが、
> 使われていないのですよね。

そうですね。NKF のオプションを生で渡すのは避けたいですが、
Convert X0208 alphabet to ASCII を抑止する何らかのオプションとか
変換するデータのメディアタイプを指定するとかだと、便利かもしれません。
または、そういう別名の関数を用意するか。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E