Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: はじめましてタイからの参加です。



 From: Hajime BABA <hajime.baba@xxxxxxxxx>
 Subject: [namazu-users-ja] Re: はじめましてタイからの参加です。
 Date: Wed, 15 Aug 2001 23:26:30 +0900

 > これで、普通に mknmz すれば、タイ語のファイルを分かち書きしながら
 > インデックスすることができました。インデックスファイルの NMZ.w を
 > 見れば、分かち書きできていることはわかります。ただし、こちらの環境
 > ではタイ語を入力することができないので、確認できたのはここまでです。
 > そもそも、私はタイ語は読めませんので正しいかどうかもよくわかりませ
 > ん。しかし、たぶんタイ語をキーワードにしても検索できるとおもいます
 > ので、よろしければお試し頂けませんでしょうか。

相変わらず入力できませんが、

  % namazu `tail -100 NMZ.w | head -1` .

というような「ワザ :-)」を使ってざっと検索実験をしてみました。検索
できる単語もあるようですが、ダメな場合の方が多いようです。具体的に
は、これ以上分かち書きしなくて良いのに、ヘンに分かち書きを行ってい
るようでした。

で、ざっと見てみたら、nmz/l10n-ja.c の nmz_is_lang_ja() が単純に
バグっていました。修正は namazu-devel-ja に投げてあります。これを
fixしたら、とりあえず LC_ALL=th (あるいは C) で検索できました。

検索してみた結果のキャプチャ画像は、

  http://www.kusastro.kyoto-u.ac.jp/~baba/tmp/namazu-thai.gif

に置いてみましたので興味があればどうぞ(一時的なものなのでそのうち
消します)。ちなみに、検索しては見たものの、どういう意味の単語で検
索したのかわからないので、ぜひ教えてくださいませ。:-)
--
馬場  肇 ( Hajime BABA )                  E-mail: hajime.baba@xxxxxxxxx
国立天文台 天文学データ解析計算センター
--