[Namazu-users-ja 533] Re: Namazu の検索 Hit 数に関して

Tadamasa Teranishi yw3t-trns @ asahi-net.or.jp
2005年 10月 18日 (火) 04:36:39 JST


寺西です。

単語の文書数を表示する簡単なプログラムを書きました。

Tadamasa Teranishi wrote:
>  
> また、実際にヒット数は 10,000 を超えているのでしょうか?
> (MaxHit を 10,000 まで増やしても検索できないから、そう判断された
> のでしょうか?)

添付の nmzcount.pl.gz を gzip -d で展開して、インデックスのある
ディレクトリにコピーします。

$ perl nmzcount.pl

とすると、インデックスに登録されている単語とその単語が含まれる文書数
を以下のように表示します。

は                  : 52
ること              : 51
を                  : 51
システム            : 51
テスト              : 52
トピック            : 7
ファイル            : 52
月                  : 1
検索                : 51
使え                : 51
手軽                : 51
全文                : 51
第一                : 51
日                  : 1
日本語              : 51
年                  : 1
平成                : 1
目指し              : 51
用                  : 52


問題の単語の文書数がいくつになっているか確認してみましょう。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns @ asahi-net.or.jp
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E
-------------- next part --------------
テキスト形式以外の添付ファイルを保管しました...
ファイル名: nmzcount.pl.gz
型:         application/x-gzip
サイズ:     448 バイト
説明:       無し
URL:        http://www.namazu.org/pipermail/namazu-users-ja/attachments/20051018/02208624/nmzcount.pl.bin


Namazu-users-ja メーリングリストの案内