namazu-ml(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

pnamazu-99.12.07



古川です。

perl 版の検索クライアントを

    http://www01.tcp-ip.or.jp/~furukawa/pnamazu/

に置きました。

#(1) ! コマンドラインで veryshort の出力を修正
#(2) + 要約を検索時に作成するときに、grep 的動作もできるようにした
#(3) + インデックスより古い簡易キャッシュファイルは作りなおすようにした
#(4) * nmzidx.pl の仕様検討中
#          -> 検索クライアント自作のためのサンプル search.pl を添付


(1) 個人的に、最近、mew-nmz を使うようになりました。その関係で、出力が
    それに合うように、修正しました。


(2) コマンドラインで --grep=on とするか、または、CGI の QUERY_STRING で
    grep=on とすると、元ファイルが読める状況では、語の含まれる行を表示
    するようにしました。

    v2 形式(v1.9.x 以降) のインデックスでは、NMZ.field.uri にファイル名
    が入っていると仮定します。

    それより前の形式では、NMZ.r にファイル名が入っていると仮定しますが、
    このファイルは、任意の行へ seek することができないので、同梱している
    linmz.pl を使って
        % perl linmz.pl NMZ.r
    として、NMZ.ri というファイルを作る必要があります。


(3) 簡易キャッシュとは、規模に比例して時間のかかってしまう検索に対し、
        フィールド検索、タイムスタンプ検索 -> 文書番号
        正規表現検索                       -> 単語番号
    をファイルに録っておくためのものです。いままでは、キャッシュした後に
    インデックスが更新されたのを感知する機能がありませんでしたが、これを
    判断するようにしました。


(4) pnamazu に入っている nmzidx.pl は、1.9.x に含まれているものに、
    検索用の機能が入っています。

    ただし、仕様は検討中で、今後変わる可能性があるため、まずは pnamazu
    に入れてみよう、というところです。

    目指すところは、「perl で検索クライアントを自作できるための部品」
    です。

    # 現状の pnamazu より、少しは美しいスクリプトができるでしょう。

    使い方のサンプルとして、tool2/search.pl というものを用意しました。

-- 
Rei FURUKAWA 
furukawa@xxxxxxxxxxxx