Namazu-win32-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: インデックス化できない文字?



こんにちは.佐久間です.



> 初書き込みです、よろしくお願いします。

メーリングリストにHTMLメールは送らないでくださいね.



> インデックス作成もできたのですが、なぜかインデックスできていない文字が
> あります。文章が長くなって申し訳ないのですが、具体的に書きますと、
> 姓が**、名がxxである、**xxという人物の名前を検索しようとしたところ
> 検索ゼロとなりました。必ず存在するはずなので変だと思って、xxで検索すると
> ヒットして表示されるのですが、なぜかxxだけで**が表示されません。

Namazuでは,文字列が存在するか否かの判定を,全文をチェックしているわけではな
く,特定のキーワードが含まれるか否かを判定しています.
つまり,"**" や "xx" はキーワードとして認識され,それが検索されるのでしょう
が,"**xx" というキーワードは認識されず,結果含まれないという判定になってし
まいます.
このキーワードの切り出しは,kakasiやchasenを使った分かち書きで決まります.辞
書を自分で作成する事で,キーワードを決める事も出来ます.

もし,"**xx" を検索するのであれば,and検索を行うため,"** xx" として検索する
か,検索に時間は掛かりますが,正規表現を使い,"/**xx/" として検索すればヒッ
トすると思います.



=== Sakuma,Hiroaki =======================================================
BEETAS.org          www.beetas.org      sakuma@xxxxxxxxxx
Webmin-JP           jp.webmin.com       sakuma@xxxxxxxxxxxxx
Waseda Univ CS                          sakuma@xxxxxxxxxxxxxxx
=== "There's More Than One Way To Do It" =================================