namazu-ml(avocado)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Namazu I18N?



もう2日家に帰っていない、しがないさらりーまんです(;_;)。

# フランスとアメリカと日本で、リアルタイムで collaboration なんぞ
# やったらいつも日本がワリを食うんだよなぁ…ブツブツ…

Satoru Takabayashi <ccsatoru@xxxxxxxxxxxxxxxxxx> wrote:

> のようなメールをいただいてしまいました ;-)。とりあえず、英語の環境
> でも動くようにして (nkf, KAKASI/ChaSen が不要)、いいかげんな 
> README.en と intro.html を書いてみました。 manual.html はしんどい
> のでもう少し後になります。
		(snip)
> に置いておきました。例によって英文はかなりあやしいのでおかしな点を
> 見つけたらこっそり私の方までお知らせください ;-) (石川さんよろしく
> お願いします)。

ご苦労さまです。ちょっと今ムチャクチャ忙しくて、明後日からシゴトで
CERN を襲撃に行かないといけないので、ヒマがあったら飛行機の中ででも
チェックしておきます。Tim Berners-Lee に Namazu を紹介しておこうか? ;-)

# CERN から帰ってきた翌日には今度は Mountain View まで Netscape を
# 襲撃に行くのであった。何とかしてくれこのスケジュール…(--;

> 	* Language = 'en' のときは mknmz で nkf および 
> 	  KAKASI/ChaSen を使わないようにしました。ゆえに英語環境で
> 	  も動くと思われます。
> 	* 上記のモードで作ったインデックスは正規表現以外ならおそら
> 	  く Latin 1 の右半分の文字も使えると思います。

特に変換処理等をしてなければ、ISO-8859-* あたりはだいたいイケるんじゃ
ないですかね。Bidirectionality を考慮しないといけない ISO-8859-6 とか
ISO-8859-8 を食わせても大丈夫かどうかはちょっとわかりませんが。多分
VISCII とか KOI8-R とか KOIー8U とかもイケると思う。これらが混ざってる
と泣きますが…。

ただ、それらを使う場合は、検索結果を HTML で出力する場合に charset
を US-ASCII とか ISO-8859-1 に指定してしまうとかえって困りますが。
このあたりも make するときに default の charset を指定できるように
なっているといいかも。

-- 
石川 雅康