namazu-dev(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

index or 索引 -> find_target: Scanned :



>                                            千葉市中央区長洲
>                                                    藤原  誠
kenji> でもウェブ上では インデックス ということばの方が
kenji> 圧倒的に使われているようですね。goo で検索すると

「圧倒的に使われている」というものさしで物事をみた場合、
世の中から Macintosh と Unix は消えてしまうということはない
でしょうか。:-) 他にも消えてしまうものは沢山あると思いますが。

ということばかり書いていると、namazu-dev の作業がとどこおって
しまうと思うので、戻します。:-)

以前は mknmz の実行時に (英語版で言うと)
 find_target: Scanned : (1267), Files: (1265), Elapsed: (8), Files/sec: (158.1).

と表示していたのですが、最近 Find.pm を使うようになってから、
Target Files: 16 (Scan Performance: Elapsed Sec.: 1, Files/sec: 16.0)
というようになったと思います。僕は最初の頃、(これらの表示はなかっ
た頃ですが) 上で言うと Scanned : と Files: の差が大きくて、
それが何が悪いか分らなくて、(表示もなかったので何が起きているか
も分らなくて)、しかも、結構時間がかかることなので、

  この設定を変えて見て、.... ?
  No files to index
  また mknmz .... ?
  この設定を変えて見て、.... ?
  ああ、こんどは欲しくないものまで見てくれてしまった

と、随分時間を費したことがあります。で、こういう表示を付けたらいい
なと思ったのです。ですから、この文で一番大切だったのは Scanned: と
Files: の差で、後はおまけで表示したらいいかなという気持で、
今でも、更に 
$DENY_REGEX
$EXCLUDE_REGEX 
$ALLOW_REGEX 
$HTML_SUFFIX 
などの原因別に(採用しなかった数を)表示するようにしたいなと思って
いるのです。

皆様はどうお思いになるでしょうか。
# 当時は shtml が入っていなかったというのも大きな原因で、いまは
# 標準で入っていると思うので、さほど問題ではないかなと思ったり
# しますが。

# ももっと言うと、
$DENY_REGEX      leaf_name
$EXCLUDE_REGEX   part of PATH

  となっていて、文字列 (DENY/EXCLUDE) から leaf/PATH の対応につい
て、その辺の名前の意味が良く分っていなかったというのもありますが。
---
(藤原)