Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

日本語全文検索システム Namazu 2.0.13 リリース



                                                        2004年4月14日
                                                       Namazu Project

           日本語全文検索システム Namazu 2.0.13 リリース


 Namazu Project は、オープンソースソフトウェア  Namazu 2.0.13 を
2004年4月14日にリリースいたしました。
 GPL2(GNU General Public License version 2)に従って、Webサイトにて
一般公開したことを発表します。

 Namazu は手軽に使えることを第一に目指した日本語全文検索システムです。
CGI として動作させることにより小中規模の WWW 全文検索システムを構築す
ることができるほか、コマンドラインから利用する用途にも使えます。 

 Namazu 2.0.12 から実に1年7ヶ月ぶりのリリースである Namazu 2.0.13 
には、オプション追加による機能強化、より多くの文書形式に対応、セキュ
リティの強化、各種バグフィックス等が行われています。
  Namazu 2.0.12 をご利用の方は、是非バージョンアップを実施されること
をお勧めいたします。


■ 主な変更内容

1.セキュリティ面の強化
  - サーバーへ無理な負荷を与える複雑な正規表現検索への対策
 - バッファオーバーフローの可能性がある箇所を修正

2.新機能の追加
  - --check-filesize オプションを追加し、タイムスタンプが同一でも
  ファイルサイズが異なるファイルを更新対象とする機能を追加

3.対応文書形式を追加(注1)
  - OpenOffice.org (Writer, Calc, Impress, Draw)文書
  - 一太郎 ver.5〜13/2004 文書
  (doccatなしで利用できるフィルタを追加)
  - RTF文書
 - Apache キャッシュファイル
  - MP3ファイル
  - PowerPoint スライドショー文書

4.関連ツールのバージョンアップに対応
  - xpdf 2.02 以降に対応
  - xpdf 3.00 の動作確認(PDF 1.5)
  - wvWare 0.7.4〜1.0.0に対応
 - Microsoft Office 2003 に対応

5.文書抽出精度の向上
 - インデックス中のノイズを削減
  ・HTML_ATTRIBUTES タグ属性(ALT/SUMMARY/TITLE)の削除機能を追加
  ・文書に混ざる制御コードの削除を徹底
    ・e-mail に含まれる base64 コード等を除去
  - HTML 文書でタグの属性(ALT/SUMMARY/TITLE)の重み付けを追加
 - 平仮名のみの単語登録、送り仮名除去処理での不具合を解消
 - Microsoft Office 文書内の半角カナの検索に対応
  - Microsoft Word 文書の複数セクションに対応
  - Adobe PDF 文書のプロパティに空データが設定されている場合に対応
  - Macbinary ファイルを誤認してノイズが混ざる問題に対処

6.バグフィックス、セキュリティホールの修正
 下記の問題をはじめ多数の修正をしました
  - 最大ヒット数の判定を誤るバグ
  - フレーズ検索が誤動作するバグ
  - 正しく強調表示、強調表示禁止ができないバグ
  - HTML 文書でスコア計算を誤ることのあるバグ

■ 動作確認OS
 Linux, FreeBSD, OpenBSD, NetBSD, Solaris, MacOS X, Win32 他

■ 配布元
 Namazu Web サイト http://www.namazu.org/ で配布しています。

■ ライセンス
 GPL2

■ 商標について
 商品名・会社名等はすべて各社、各組織の商標または登録商標です。 

(注1)
  文書フィルタの他に、アプリケーションまたは Perl モジュールの
  インストールを必要とするものがあります。

■ 本件に関するお問合せ先
  Namazu Project
 e-mail: info@xxxxxxxxxx
  URL: http://www.namazu.org/
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E