namazu-ml(avocado)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Q. about mknmz



加藤というものです.

つい最近まで,MHonArc で HTML 化したモノを glimpse で検索していたので
すが,どうも glimpseindex が再現性なくハングアップしてしまうので,
namazu に乗り換えることを考えています.

さて,以下の点について教えていただけると,とてもありがたいのですが...


#スーパー勘違いしているような気もするのですが....もしそうでしたら,
#お騒がせしてすみません (_ _).

[質問]
(1) mknmz は,前回以降に追加されたファイルのみを抽出し,以前に作成され
    たインデックスを再構成する形で作られるのではないのでしょうか?
(2) それとも,インデックスも単に追加されるだけで,再構成には何等かの工夫が
    必要なのでしょうか?
(3) 現在,私の環境では,(2) の状態になっているような気がしますが (別紙
    参照),これが仕様でないとすると,考えられる/想像される要因は何で
    しょうか?

(4) マニュアルによると,
	「また、 maillist.html や threads.html といった MHonArc の作成
	するインデックスをスキップします。」
    と書いてありますが,
	「'<\!-- MHonArc v\d\.\d\.\d -->' というヘッダがついた
	 (ex. maillist.html や threads.html といった) MHonArc の作成するイ
	  ンデックスをスキップします.」
    という理解でよいのでしょうか?
    (古い MHonArc (ver.1.2.2 や 2.0.1) ではこのヘッダがないので,スキッ
     プされず,ちょっとびっくりしたのでお聞きしています).


[私メの環境]
(1) SunOS Release 4.1.3-JLE1.1.3_U1
(2) perl 5.003 with EMBED built under sunos + suidperl security patch
(3) kakasi 2.2 92/08/02 takahasi Exp $ written by H. Takahashi
	-w: wakatigaki mode (added by H. Baba, Sun Jul  7 16:52:40 JST 1996)
(4) nkf v1.62
(5) gcc version 2.6.3



----------------- 以下,別紙ここから ---------------
1.元々ある記事を mknmz する.

> mknmz -u "http://kushinagar.mm.nttdata.co.jp/~tumibito/Mail/hideki/" .
0 http://kushinagar.mm.rd.nttdata.co.jp/%7Etumibito/Mail/hideki/msg01000.html
1 http://kushinagar.mm.rd.nttdata.co.jp/%7Etumibito/Mail/hideki/msg01001.html
2 http://kushinagar.mm.rd.nttdata.co.jp/%7Etumibito/Mail/hideki/msg01002.html
		:				:
			(えんえんと続くので略)
		:				:
99 http://kushinagar.mm.rd.nttdata.co.jp/%7Etumibito/Mail/hideki/msg01099.html

[Base]
Date: Mon Feb 23 12:20:36 1998
Files: 100 files
Size: 287,786 bytes
Keywords: 3,516 words
Time: 70 sec.
(using unsignedcmp routine)

> namazu . '依頼'
検索結果

参考ヒット数:  [ 依頼: 16 ] 
検索式にマッチする 16 個の項目が見つかりました。

1. Re: 依頼事項 5/7- (Re: 進捗 (5/6) について ) (score: 30)
Re: 依頼事項 5/7- (Re: 進捗 (5/6) について ) [Prev][Next][Index][Thread] To: Hiroshi Kato <tumibito@xxxxxxxxxxxxxxxxxxx> Subject: Re: 依頼事項 5/7- (Re: 進捗 (5/6) について ) From: Hideki Takahashi <
http://kushinagar.mm.rd.nttdata.co.jp/%7Etumibito/Mail/hideki/msg01098.html size (2,664 bytes)
		(以下,略.期待値通り 16 ファイルが表示される)


2.'依頼' という単語が入っているファイル (msg01901.html) を追加

> mknmz -u "http://kushinagar.mm.rd.nttdata.co.jp/~tumibito/Mail/hideki/" .
100 http://kushinagar.mm.rd.nttdata.co.jp/%7Etumibito/Mail/hideki/msg01901.html

> namazu . '依頼'
検索結果

参考ヒット数:  [ 依頼: 1 ] 
検索式にマッチする 1 個の項目が見つかりました。

1. Re: eigenを ~dic/JISYOSAKUSEI1.1 にコピーしました。 (score: 5)
Re: eigenを ~dic/JISYOSAKUSEI1.1 にコピーしました。 [Prev][Next][Index][Thread] To: hideki@xxxxxxxxxxxxxxxxxxx Subject: Re: eigenを ~dic/JISYOSAKUSEI1.1 にコピーしました。 From: Hiroshi Kato <tumibit
http://kushinagar.mm.rd.nttdata.co.jp/%7Etumibito/Mail/hideki/msg01901.html size (3,085 bytes)
	(???前に登録した内容はどこに?)


3.rm NMZ.* して,最初からインデックスを作成.
> mknmz -a -u "http://kushinagar.mm.rd.nttdata.co.jp/~tumibito/Mail/hideki/" .
0 http://kushinagar.mm.rd.nttdata.co.jp/%7Etumibito/Mail/hideki/msg01000.html
1 http://kushinagar.mm.rd.nttdata.co.jp/%7Etumibito/Mail/hideki/msg01001.html
			(略)
99 http://kushinagar.mm.rd.nttdata.co.jp/%7Etumibito/Mail/hideki/msg01099.html
100 http://kushinagar.mm.rd.nttdata.co.jp/%7Etumibito/Mail/hideki/msg01901.html

[Base]
Date: Mon Feb 23 12:39:26 1998
Files: 101 files
Size: 290,871 bytes
Keywords: 3,562 words
Time: 64 sec.
(using unsignedcmp routine)

> namazu . '依頼'
検索結果

参考ヒット数:  [ 依頼: 17 ] 
検索式にマッチする 17 個の項目が見つかりました。

1. Re: 依頼事項 5/7- (Re: 進捗 (5/6) について ) (score: 30)
Re: 依頼事項 5/7- (Re: 進捗 (5/6) について ) [Prev][Next][Index][Thread] To: Hiroshi Kato <tumibito@xxxxxxxxxxxxxxxxxxx> Subject: Re: 依頼事項 5/7- (Re: 進捗 (5/6) について ) From: Hideki Takahashi <
http://kushinagar.mm.rd.nttdata.co.jp/%7Etumibito/Mail/hideki/msg01098.html size (2,664 bytes)
	(今度は,期待通りに検索)


4.1の NMZ.i を wdnmz してみる.
	:
位置付け	1
依頼	16		<--- 16 個になっている.
囲み	1
	:


5.2の NMZ.i を wdnmz してみる.
	:
ヤメ	1
依頼	1		<---- オヨヨ?
下さい	1
	:
位置付け	1
依頼	16		<---- どうして2回出てくるの?
囲み	1
	:

6.3の NMZ.i を wdnmz してみる.
	:
位置付け	1
依頼	17		<---- こうなっていると思っていたのに (T_T)...
囲み	1
	:
----------------- 以下,別紙ここまで ---------------
============================================================
	加藤裕史@ NTTDATA 通信 (株)
	    技術開発本部 マルチメディア技術センタ
	    マルチメディア SI 担当  ドキュメント新サービス
			E-mail: tumibito@xxxxxxxxxxxxxxxxxxx
============================================================