Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

pnamazu-2000.05.08



古川です。

perl 版検索クライアントを

http://www01.tcp-ip.or.jp/~furukawa/pnamazu/

に置きました。

#(1)! 簡易要約機能が有効になっていないと grep 機能が働かなかったのを修正
#(2)! NMZ.[ms]i? が無いときの後方・部分一致検索の動作を、本家と同じに
#     した(わかち書きをやめた)。また、簡易キャッシュを有効にした。
#(3)! 複数インデックス検索時に、NMZ.{head,foot}.* をもう少し根気よく
#     探すようにした (Thanks to 小関吉則さん)
#(4)+ pnamazu 用の NMZ.tips.ja, NMZ.body.ja を同梱

(1) grep 機能とは、元ファイルを読んで、語を含む行を表示する機能です。
    この機能が、簡易要約機能 (元ファイルを読んで、検索時に要約を作る
    機能) を有効にしていないと、働かないようになっていましたので、
    これを修正しました。


(2) perl 版では、後方・部分一致では、NMZ.m, NMZ.mi, NMZ.s, NMZ.si とい
    う補助インデックスファイル (以下、NMZ.[ms]i? と言います) を使い、
    わかち書きとの併用が可能になっています。

    (例)
    kakasi の辞書には「全文検索」がないため、「全文」「検索」と
    分かれて登録されています。このとき「*全文検索*」を、きちんと
    "*全文 検索*" と処理できる、という意味です。


    そして、NMZ.[ms]i? が無い場合には、NMZ.w を使って、同等の検索をして
    いました。

    今回からは、NMZ.[ms]i? が無い場合には、正規版と同様、/全文検索/ と
    扱われます。従って、「*全文検索*」はヒットしなくなります。
    これをヒットさせたい場合には、NMZ.[ms]i? を作る必要があります。

    このようにする理由は、
        NMZ.w だけで後方・部分一致検索式をわかち書きするのは、
        速度が遅い

        ならば、無理にわかち書きするのはやめて、少しでも速くなった
        方が嬉しい人もいるかも

        したいという人は、補助インデックスを作ってもらえばよい
            (インデックスのあるディレクトリで、"perl bwnmz.pl" と
             するだけです)

    NMZ.[ms]i? が無い場合の後方・部分一致検索は、簡易キャッシュ機能の
    対象になります。

# くり返しになりますが、ここで「わかち書きしない」と言っているの
# は、「後方・部分一致検索との組み合わせ」だけです。通常のわかち
# 書きは、いままで通りおこなわれます。
    

(3) 複数インデックスの検索のとき、インデックスの親ディレクトリしか、
    NMZ.head.*, NMZ.foot.* を探していませんでした。これを、子ディレ
    クトリも探すようにしました。

(4) perl 版は、正規版と、使える検索式が少し違うので、それを反映した、
    NMZ.body.ja, NMZ.tips.ja を作りました。

-- 
Rei FURUKAWA 
furukawa@xxxxxxxxxxxx