Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

mknmz -F について



はじめまして。船木と申します。
現在、DBに文書を保存し、SQLの中間一致検索で全文検索を行っておりますが、文書数が
多くなってきて、検索速度が落ちてきましたので、namazuにて全文検索するように
version upしようと考えています。

やり方としては、文書管理IDを名前に持つファイルをテンポラリで作って、
それに対してmknmzをしてindexを作成し、namazuでファイル名を出力するように
し、その結果を加工してDBを読み出そうとと考えています。
# namazu+PostgreSQL(with pgnmzsrch)+Apache+PHPという仕様を考えています。

しかし、ファイル数が多いので、全ファイルを一度に置いておくことができそうにないので
少しずつ切り出してはmknmzしようと考えています。
# namazuでは、ファイルの実体を消しても、indexさえあれば全文検索できるという
# 仕様だと言うことなので、これは可能だと思っていますが、ただしいですか?

で、マニュアルやMLを色々見てみたのですが、調べ方が悪いのか、知りたいことが
出てきませんでしたので、知り得た事をもとにお伺いしたいのですが
1)-Fオプションで指定するファイルは、index対象とするファイル名を1行に1つずつ書いた物である
と言うことですが、index対象のファイルパスは絶対パスになりますか、相対パスになりますか?

2)-Fオプションで指定するファイルには、「index対象ファイル」を書き並べることになっていますが、
それ以前(つまり、indexをつくったあとに消してしまったファイル)は、どのような扱いになりますか?
消えた物として取り扱われますか?そのままindex対象として残りますか?

3)2)で、仮に消える物とした場合、目的のような「indexの追加」を行うためには
別のディレクトリに作ったindexと既存のindexをマージする以外に方法はないでしょうか?

4)仮に2)でindexが残る場合、既に作ったindexから対象文書をはずすために、
-Fオプションで与えるファイルにindex対象ファイル名を書き、実際はindex対象ファイルの実体を
作らないでおけば、ファイルが消えたことになると考えたのですがこれは可能ですか?

先達のご教示をよろしくお願いいたします。


----
Yoshio Funaki  yoshio@xxxxxxxxxxxxxxxxx