namazu-ml(avocado)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

v1.2.1.0-beta-10 and v1.2.0.7-beta-5



高林です

検索結果の要約部分に文書が Mail/News の場合は

  Date: Tue, 2 Jun 1998 00:40:33 +0900
  From: Satoru Takabayashi <ccsatoru@xxxxxxxxxxxxxxxxxx>

といったヘッダをつけていますが、これをその他の文書についても追加し
ようと考えています。

Mail/News の場合はヘッダから Date:, From: のフィールドをそのまま使
えば良いとして、その他の場合は少し工夫をする必要があります。

Date: を単にファイルスタンプから得るとコピーしてきたファイルの場合
にすべて日付が同じというむなしい事態が起こり得ます。 RCS のスタン
プくらいはみることができそうですがまだ実装していません。

RFC の文書の場合はヘッダ部分を解析すれば Author: と Date:
("January 1997" といった精度だけど) を抽出することも無理ではなさそ
うです。決まった書式がいまいち不明なので完全な処理はできそうにあり
ませんが。

HTML の場合は <ADDRESS> 〜 </ADDRESS> の間からメイルアドレスを抽出
して +author: として使うようにしました。また、 <TITLE> 〜 </TITLE>
も +title: というフィールドとして記録します。

実際には +author: と +from:, +title: と +subject: はそれぞれ同一視
しているので検索時には

% namazu '+author:ccsatoru'
% namazu '+from:ccsatoru'

は同じ意味になります。

それから、 +url: というフィールドを足しておきました。

そんなわけで上記の改良を加えた namazu-1.2.1.0-beta-10.tar.gz を

<URL:http://saturn.aichi-u.ac.jp/%7Eccsatoru/Namazu/proto/>

に置いておきました。 v1.2.1.0 の仕様もそろそろ落ち着いてきたかなと
思います。

v1.2.1.0-beta-10
	[09/14/1998]

	* mknmz のオプションを追加
	  -D: Date:, From: といったヘッダ要約につけない 
				(ディフォルトではつける)
          -X: フィールド検索用のインデックスを作らない
				(ディフォルトでは作成する)
	* インデックス作成時に NMZ.field.url を作成するようにした
	* HTML の title を NMZ.field.subject に記録するようにした
	* HTML の author を NMZ.field.from に記録するようにした
	* 検索時に +title: と +subject: を、 +author: と
	  +from: を同一視することにした
	* CGI で渡される dbname 異常に長いと core dump してしまう
	  バグを修正
	* DBNAMELENG_MAX と QUERYLENG_MAX を 256 に設定した
	  (データベース名の最大長とクエリーの最大長)
	* BUFSIZ をやめて BUFSIZE (1024) に統一した

…それから、namazu-1.2.0.7-beta-5.tar.gz も同じところに置いて
おきました。こちらの方はそろそろ v1.2.0.7 として公開しようと考えて
います。これが v1.2.0.x シリーズの最終版になると良いのですが。

-- Satoru Takabayashi