Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: はじめましてタイからの参加です。



 From: "HASEGAWA" <mailmag@xxxxxxxxxx>
 Subject: [namazu-users-ja] Re: はじめましてタイからの参加です。
 Date: Thu, 16 Aug 2001 15:31:07 +0700

 > >   http://www.kusastro.kyoto-u.ac.jp/~baba/tmp/namazu-thai.gif
 > 早速、画像のほうを拝見させて頂きました。
 > 完璧にインデックシングされているようです。
 > サーチした単語はタイ語で”プログラム”となっていますが
 > その単語が含まれたテキストが確かにヒットしております。

なるほど、「プログラム」でしたか。しかし、いったいどこでヒットして
いるのかわからなかった :-) ため、

  マルチリンガル化(M17N) w3m 
  http://www2u.biglobe.ne.jp/~hsaka/w3m/index-ja.html#m17n

を使って、HTML でキーワード強調表示をさせてみました。キャプチャは

  http://www.kusastro.kyoto-u.ac.jp/~baba/tmp/namazu-thai-html.gif

としてあります。確かにヒットしているようですね。

# <strong class="keyword">キーワード</strong> では xiterm+thai だと
# 見た目の違いがわからなかったので、~/.namazurc で
#   #EmphasisTags  "<strong class=\"keyword\">"   "</strong>"
#   EmphasisTags  "<a href=\"\">"   "</a>"
# というような小細工をしてありますが。

なお、要約部の折り返しの表示が一部乱れていますが、w3m-m17n のせいか、
xiterm+thai のエスケープシーケンスが整っていないせいかは不明です。
おそらく後者ではないかとおもってはいますがよくわかりません。


 > 生憎、昨日のメールを自宅のパソコンで読んだために
 > メールボックスにメールが残っておらず、オフィースでの
 > 書き換え作業が出来ていません。

Perl スクリプト部分は先の変更で大丈夫ですが、C の部分はコンパイル
し直さなければなりませんので、Windows 側ではちと面倒かもしれません。


 > しかし、こうして現実に検索できるところをみると本当に
 > 一ヶ月間一人で悩んでいたのが嘘のようです。
 > タイではこれまでいくつかの全文検索システムを試しましたが
 > マルチランゲージ対応という物で試したところタイ語の一文字
 > ずつに全てインデックスが付けられていて驚いたことがありました。

日本語でもしばらく前まではそうするのが普通だったのですから、そうす
るのも致し方ないところだったのかもしれません。これを機会に、他の言
語にも対応させていくことができればいいかなとはおもいます。
--
馬場  肇 ( Hajime BABA )                  E-mail: hajime.baba@xxxxxxxxx
国立天文台 天文学データ解析計算センター
--