Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: インデックス生成時間と kakasi 辞書ファイルについて



廣瀬と申します。

At Fri, 24 May 2002 12:08:57 +0900,
後藤 史織(AC−Tech) wrote:

> 私が調べたところでは、インデックスの生成の際、デフォルトで差分だけ
> 更新され、gcbmzというツールを利用することで、インデックスを掃除する
> ことが出来るとのことなのですが、
> その際、差分だけ更新するということは、インデックス生成の時間も
> 2回目以降は大幅に減少するのでしょうか?

はい、大幅に減少します。

> 例えば、更新されているファイルが1つしかなければ、
> 1つのドキュメントのインデックスを生成する時間と同じ。と
> 考えて宜しいのでしょうか?

いいえ。
mknmzでインデックスを作成、その後数回インデックスを更新した場合
すでにあるインデックスと実際のファイルの調査をしますから、その分の
オーバーへッドは存在します。

また、
存在しないファイルの情報も、そのままインデックスに残っています。
gcnmzはその不要なインデックスの情報を削除してくれます。
しかし、このインデックスの掃除はかなりの時間を必要とします。


> 他の辞書ファイルを参照させたり、kakasiの辞書ファイルに、単語を登録したい
> と考えておりますが、そのそのようなことは可能でしょうか?

以下のURLをご覧下さい。
http://www.namazu.org/ml/kakasi-dev/msg00034.html

----
HIROSE, Yoshihide