namazu-ml(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

半生の韓なま



すぎうらしろうです。

Namazu 1.9.13 をベースに、ちょっといじってハングルを検索するするよう
にしてみました。未完成なので自称"半生(はんなま)の韓なま(はんなま)"で
す。現在はとりあえずなんか動いているというレベルです。

[Base]
Date: Sat Jan 29 00:53:47 2000
Added Files: 1,087 files
Total Files: 1,087 files
Size: 3,333,756 bytes
Added Keywords: 46,049 words
Total Keywords: 46,049 words
Perl: 5.00503
Namazu: 1.9.13
System: freebsd
Wakati: cat 
Time: 127 sec.

というファイル群から"あんにょんはせよ"を検索している風景はこちら↓
時間がたつとなくなっている可能性あり。

	http://www.kt.rim.or.jp/~sugiura/han.gif

mknmzの結果を見ての通り、わかち書きに`cat`を使うという暴挙に出て
おり、韓国語表記でふつうに使われる"ティオッスギ(わかち書き)"に全
てを託しています。本当は助詞、助動詞、形容詞などの分離が必要なの
ですがそこまで韓国語をわかっていないので、これから韓国語入門を見
ながら手をつけるかつけないかどうしようかなという所です。
MIMEエンコードされた韓国語は検索できるのか?も未確認。

"半生(はんなま)の韓なま(はんなま)"の作り方

1: モジュールとか nkf とか kakasi の入っていないマシンを用意
   入っていてもいいかも知れないけど、どういう影響がでるかが不明
2: ハングルの nkf 相当品をインストール。私は hcode を使った
3: おもむろに ./configure, make, su -, make install
4: PREFIX/share/namazu/pl/codeconv.pl の
   my $nh = util::efopen("|$conf::NKF -emXZ1 > $nkftmp"); を
   my $nh = util::efopen("|$conf::NKF > $nkftmp"); にしてみる
5: PREFIX/etc/namazu/mknmzrc を
   --------------------------------------
   $conf::NKF = "hcode "; 
   $conf::WAKATI = "cat ";
   --------------------------------------
   とかにしてみる。
7: 韓国語テキストを入手し、いつものように index を作る
8: 検索する
9; 結果が出る
10: ちょっと嬉しい

基本的に LANG は ja のままでやってます。

--  
      すぎうらしろう(Sugiura Shiro)      E-mail : sugiura@xxxxxxxxxxxx
       御希望の方に、もれなく less-332.tar.gz をプレゼントしています
      [     If you want to talk with me, you MUST speak Japanese     ]