Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: インデクスの縮小化



寺西です。

Tadamasa Teranishi wrote:
> 
> インデックス作成時に最大文章数を指定し、検索時に最大ヒット数を
> 指定するということです。
> 最大文書数を unlimit にすれば、現状と同じです。
> 
> 最大文章数を指定することは、インデックス作成時にもオプションで
> スコアの低いものを切り捨てることができるということです。
> 
> フォーマットも変更する必要がないので 2.0系でも使えます。
> 
> が、ここで問題発生。単語検索用途でつい考えてしまっていて、
> AND 検索でこれをやると、極端にヒット率が悪くなることが予測
> されます。
> ということで、単語検索用途でしか意味をなさない気がしてきました。
> 
> # 自分の用途のことしか頭が回っていなかった。むむむ。

自分のメモをごにょごにょ調べてみると、
インデックスをダイエットする自作ツールで、上記のことをやろうと
していました。
しかも、単語専用でなおかつ、スコアでソートに限ると但し書きがあり、
とっても限定用途用だったようです。
# 昔の私は気づいていたんだ。なのに今気づかないのはいったい...。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E