Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: 特定のパターンで検索する際「Out of memory!」になる



寺西様、先週はどうもお世話になりました。
いくつか進展しました。

まず、ローカルで pnamazu を動作するようしました。
「お土産」というパターンも検索できました。
ただ、時間はかかるようで、そのためサーバー上では Out of memory! になるの
だろうと思います。(バグ等ではなく。)

サーバー上でも {お 土産} (pnamazu では分かち書きの結果が{}で括られます)と入力すれば、検索できることがわかりました。
そのとき、「お」68,000 「土産」2,700 という結果になります。
「い土産」「う土産」(意味はないですが)と検索すると、もともとOut of memory! にはならないのですが、ひらがな一字部分は、20,000 〜 30,000 です。Out of memory! になるかならないかの境がその辺にあるようです。

そこで、MaxHit 等の値を調節すると、「土産」の方には反映するのですが、
(2,700 より小さくすると Too many 〜 になります)「お」のキーワードの
登録数には反映しません。そもそも 初期値の MaxHit 10,000 / MaxMatch 1,000 では、「お」68,000 というキーワードが出てくるのがよくわかりません。インッデックス作成に問題があったのでしょうか?

pnamazu 専用の pconf という設定ファイルもあるようで、そちらもいじってみています。(現状、どの値をいじっても制御できていません。)