namazu-ml(avocado)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: Namazu I18N?
もう2日家に帰っていない、しがないさらりーまんです(;_;)。
# フランスとアメリカと日本で、リアルタイムで collaboration なんぞ
# やったらいつも日本がワリを食うんだよなぁ…ブツブツ…
Satoru Takabayashi <ccsatoru@xxxxxxxxxxxxxxxxxx> wrote:
> のようなメールをいただいてしまいました ;-)。とりあえず、英語の環境
> でも動くようにして (nkf, KAKASI/ChaSen が不要)、いいかげんな
> README.en と intro.html を書いてみました。 manual.html はしんどい
> のでもう少し後になります。
(snip)
> に置いておきました。例によって英文はかなりあやしいのでおかしな点を
> 見つけたらこっそり私の方までお知らせください ;-) (石川さんよろしく
> お願いします)。
ご苦労さまです。ちょっと今ムチャクチャ忙しくて、明後日からシゴトで
CERN を襲撃に行かないといけないので、ヒマがあったら飛行機の中ででも
チェックしておきます。Tim Berners-Lee に Namazu を紹介しておこうか? ;-)
# CERN から帰ってきた翌日には今度は Mountain View まで Netscape を
# 襲撃に行くのであった。何とかしてくれこのスケジュール…(--;
> * Language = 'en' のときは mknmz で nkf および
> KAKASI/ChaSen を使わないようにしました。ゆえに英語環境で
> も動くと思われます。
> * 上記のモードで作ったインデックスは正規表現以外ならおそら
> く Latin 1 の右半分の文字も使えると思います。
特に変換処理等をしてなければ、ISO-8859-* あたりはだいたいイケるんじゃ
ないですかね。Bidirectionality を考慮しないといけない ISO-8859-6 とか
ISO-8859-8 を食わせても大丈夫かどうかはちょっとわかりませんが。多分
VISCII とか KOI8-R とか KOIー8U とかもイケると思う。これらが混ざってる
と泣きますが…。
ただ、それらを使う場合は、検索結果を HTML で出力する場合に charset
を US-ASCII とか ISO-8859-1 に指定してしまうとかえって困りますが。
このあたりも make するときに default の charset を指定できるように
なっているといいかも。
--
石川 雅康