Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: .mhonarc.mrc の日本語ボタン (Re:MHonArc 2.6.3...)



寺西です。

# MHonArc ネタで申し訳ないです。

藤原 誠 / Makoto Fujiwara wrote:
> 
> 寺> JIS で書けない根拠は何でしょう。普通なら書けると思いますが、何か
> 寺> 問題がありますか?
> 
> .mhonarc.mrc は 当然プログラムから読みますが、そういう時、もし
> euc 等に変換しないと、日本語か英語(ascii)かの判別論理が面倒です
> よね。

namazu が内部の漢字コードを EUC としている理由のひとつ(それ以外は
知らないけど。)は、そうです。

しかし、MHonArc では Namazu と違って .mhonarc.mrc の日本語と英語を
判別する必要が基本的にありません。タグを用いて切り出しができるので、
ユーザが自由に定義できる(日本語を含む)文字列の場所は、限定されます。
また、その文字列はほとんど解析する必要がなく、そのまま HTML に
出力すれば良いわけです。

ただ1点の問題は、出力すべき文字列に '$xxx$' が含まれていると、それは
変数だとみなして、文字列の置き換えを行うことです。
JIS の場合、'$' が含まれますので、ここで問題は生じますが、
namazu-devel-jp#02920 に書いた 2 つの方法で回避できるようです。

なお、rcfile に記述した漢字コードは変換されずに HTML に出力されるため、
出力する HTML の漢字コードに合わせて rcfile を書かなければ、複数の
漢字コードが混在する HTML になってしまいます。
numeric character reference で出力させるのなら、numeric character 
reference で書くということです。
# となると、HTML に出力する前にコード変換ルーチンを通した方が良い
# のかもしれません。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E