[Namazu-devel-ja 1542] 日本語全文検索システム Namazu 2.0.17 リリース

Tadamasa Teranishi yw3t-trns @ asahi-net.or.jp
2007年 3月 12日 (月) 22:55:41 JST


                                                       2007年03月12日
                                                       Namazu Project

           日本語全文検索システム Namazu 2.0.17 リリース


 Namazu Project は、オープンソースソフトウェア  Namazu 2.0.17 を
2007年03月12日にリリースいたしました。
 GPL2(GNU General Public License version 2)に従って、Webサイトにて
一般公開したことを発表します。

 Namazu は手軽に使えることを第一に目指した日本語全文検索システムです。
CGI として動作させることにより小中規模の WWW 全文検索システムを構築す
ることができるほか、コマンドラインから利用する用途にも使えます。 


■ 主な変更内容

1.セキュリティ面の強化
  (緊急度:低)
  - テンプレートをカスタマイズした場合にバッファオーバーフロー 
    を起こす可能性があった箇所を修正
  - フレーズ検索で free したメモリにアクセスする不具合を修正
  - 「"」「/」で検索すると強調表示で無限ループに入るバグを修正
  - フィールド検索で正規表現検索を無効にできないバグを修正
    (REGEX_SEARCH)

2.新環境への対応(Windows版)
  - Microsoft Windows Vista 対応
  - Microsoft Office 2007 対応(OLEコントロールフィルタ)
  - Microsoft Visio 2000, Visio 2007 対応(OLEコントロールフィルタ)

3.対応文書形式の追加
  - Microsoft Office 2007 形式の Word, Excel, PowerPoint ファイルに
    対応(OLEコントロールフィルタ)
  - Microsoft Office Open XML 形式のファイルに対応
    (filter/msofficexml.pl は実験的)
  - Microsoft Viso XML 形式 .vdx ファイル(filter/visio.pl は実験的)
  - OutlookExpress, Thunderbird 等のメールが保存する .eml ファイル

4.性能向上
  - 従来より高速な File-MMagic 1.27 を同梱
  - 削除文書が多いインデックスで HIT 数が多い場合に速度が落ちる不具合
    を修正
  - 検索時の内部データのコピー回数を減らし最適化

5.文書抽出精度の向上
  - メール文書:base64/qencode でエンコーディングされた日本語テキスト
    に対応(filter/mailnews.pl)
  - メール文書:マルチパートの途中で切れているメールに対応
    (filter/mailnews.pl)
  - html文書:<script> タグ処理の不具合を修正(filter/html.pl)
  - html文書:XHTML 形式 META タグ "/>" 処理を修正(filter/html.pl)
  - 一太郎5,6文書:文字化けの原因になる機種依存文字、外字を除去
    (filter/taro56.pl)

6.新機能
  - インデックスチェック用ツール nmzchkw.pl を同梱(misc)

7.バグフィックス
 下記の他多数の不具合を修正

  [mknmz関係]
  - ファイルサイズが$FILE_SIZE_MAXを超えた場合のエラーメッセージが
    不適切
  - --update オプションで指定したディレクトリの NMZ.status の内容が
    読み取れない場合の不具合
  - MinGw で未サポートの SIGALRM を signal に使っていることと、alarm
    を SetTimer としている不具合
  - パス区切り文字を含まないファイル名がタイトルに入らない不具合
  - 一太郎5,6文書:ある種の罫線が含まれると無限ループに入る不具合
    (filter/taro56.pl)
  - zipファイル処理時にテンポラリファイルが残るバグ(filter/zip.pl)
  - MacOS + gettext 0.14.2 の環境で、システムの言語設定が優先される
    不具合
  - --debug オプション指定時に PDF ファイルがプロテクト付きと誤認
    される不具合(filter/pdf.pl)
  - MP3-Info の新しいバージョン 1.21 に対応(filter/mp3.pl)

  [namazu/namazu.cgi関係]
  - Windows版で強調表示されない場合がある不具合
  - 部分一致検索の結果が強調表示されない不具合
  - HTMLエンコードされるキーワードが強調されない不具合
  - XHTML出力時に閉じタグを "/>" と出力する不具合(" />" に変更)
  - whence, max に空の値を設定した場合は、デフォルト値を使うように
    修正

  [ユーティリティ関係]
  - gcnmz, nmzmerge のログでのカンマ区切りが、mknmz と異なる不具合

  [その他]
  - 一部環境で make clean に失敗する不具合

■ 配布元
  Namazu 2.0.17 は、
 Namazu Web サイト <http://www.namazu.org/> で配布しています。

■ ライセンス
 GPL2

■ 本件に関するお問合せ先
  Namazu Project
 e-mail: info @ namazu.org
  URL: http://www.namazu.org/
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns @ asahi-net.or.jp
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E




Namazu-devel-ja メーリングリストの案内