[Namazu-devel-ja 488] Re: Namazu 2.0.15 pre1

Yukio USUDA m6694ha392t @ asahi-net.or.jp
2005年 7月 21日 (木) 00:17:41 JST


臼田です

Tadamasa Teranishi wrote:

> この修正内容が Namazu 2.0.15 に反映されることになります。
> 
かなり修正項目がありますね

一般ユーザー向けでなさそうな(私が理解しきれなかった)ところを
削って 2.0.13 のときのリリースノート風に並べてみました。
リリースノートのたたき台にしてください。

今回のトピックは Win32 対応強化ですから
Win32 インストーラも正規版にできるとよいですね


■ 主な変更内容

1.新機能の追加
  - 分かち書きツール mecab に対応
 - ファイル名検索の追加($SEARCH_FIELD に filename の追加が必要)

2.MS-Windows 環境での動作向上
  - OLE コントロールフィルタの安定性向上
  - インデックス作成時のネットワークドライブ(UNC パス)指定に対応
  - Windows 95,98 での動作確認
  - 各種フィルタの Win32 環境への対応(msword.pl, excel.pl, powerpoint.pl 等)

3.対応文書形式を追加(注1)
  - Gnumeric 文書
  - KOffice 文書(KWord, KSpread, KPresenter, Kivio)
  - Macbinary ファイル(文書抽出するフィルタに変更)
  - Mail 内の添付ファイル(--decode-base64 オプション使用時)
  - MHTML 文書(--decode-base64 オプション使用時)
  - OpenOffice.org2.0 OpenDocumentフォーマット文書
  - Pipermail 文書
 - ZIP ファイル

4.文書抽出精度の向上
 - MS-Office 文書に混ざるマークアップタグの削除
 - MS-Office 文書内のフィールド情報(title, author, keywords)の抽出
  - mailutime に timezone を考慮

5.バグフィックス
  下記の問題をはじめ多数の修正をしました
  - html, excel ファイルのインデックス作成が低速になるバグ
  - %01 がqueryに含まれる場合の強調表示のバグ
 - ファイルの中身に 0x7f(DEL) を含むと、それ以降の文字列が無視されるバグ
  - ドイツ語テンプレートの lang が dn になっているバグ
  - 文書削除後に新たに追加した場合、NMZ.head の文書数を誤るバグ
  - ファイル名に機種依存文字があると NMZ.field.uri がずれるバグ
  - nmzmerge で一方の field の種類が無効になるバグ
  - gcnmz, lnnmz, nmzmerge でテンポラリファイルが残るバグ
  - 検索式と補助検索式の評価順序のバグ
  - MS-Office 未インストールの MS-Windows 環境で mknmz が停止するバグ

6.必要外部プログラムの整理
  - lv 依存の解消(nkf2.* または Perl5.8.* 使用の場合)

7.開発者のための機能追加、修正
  - MS-Windows 環境を考慮した Perl 版テストツールの整備
  - テンプレート、ヘッダ等を html 規格に合うように修正
  - namazu.spec を修正。RPM, SRPM の作成が可能
  - 入れ子構造のファイル用の文書フィルタに対応(例:mailnews.pl, zip.pl)


臼田幸生




Namazu-devel-ja メーリングリストの案内