namazu-ml(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: インデックスの作り方について



こんばんは。佐川です。
(はじめまして、かな?)

以下の引用部分は' Totsuka Ryutaro 'さんの
"[namazu 1306] インデックスの作り方について"からのものです。
(snip)
 >ある助平な人?からのクレームですが「すけべ」と入力して検索する
 >と、結果を返してくるのですが、該当文書には「すけべ」が含まれて
 >いないようなのです。
 >どうも、「す」と「けべ」で or 検索しているようです。

 >この元文書がhtml書式になっていない事が、問題なのでありましょうか?
分かち書き用のソフトの問題です。
だから、関係ないと思います。

 >インデックス作成時のコマンドは、
 >mknmz -D -K -u -W -O C:\usr\local\namazu\index\za d:\yorozu\
 >です。
とのことから、インデックスの作成は Windows 上で行っているので
kakasi を用いていると思います。

kakasi 分かち書きパッチのドキュメント
(kakasi-ext.tar.gz の KAKASI.DOC)を読むと、

 > 5. 制限・コメント
 >
 >・単語確定にちゃんと辞書を引く分、動作はあまり速くありません。
 >・ひらがな(カタカナ)ばかりの文章には依然として弱いです。
 (以下略)

とあるので、"すけべ"という語を
一語として認識させるために、
kakasi 辞書に単語を追加するのが、よろしいかと思います。
# かといって、「すけべ」を追加すると、「すけべ」のを含む他の
# 言葉にヒットするかもしれません。
# ex. 「めし」を登録したら、「うら:めし:や:〜」になったとか。(汗)

辞書の作り方は、
[namazu 1003] Re: KAKASIのカスタマイズ
http://ml.namazu.org/namazu-ml/ring/msg00997.html
や kakasi の JISYO というファイルを参考にしてください。

そうそう、辞書を作り直したらインデックスも作り直す必要がありますから
忘れずに。

でわ。

・・・・‥‥‥‥‥‥…………━━━━━☆
 佐川  昭宏  mailto: sagawa@xxxxxxxxxx
             http://pelican.sohgoh.net/
 PHP3 を使ったメールソフト    ↑99/11/25
 "Pelican Web Mail"公開中!! ─┘ v1.0.60