[Namazu-win32-users-ja 75] 検索結果の一部に存在しないアドレスが表示されます
PCW\)坂野 裕章
hsakano @ pc-works.co.jp
2004年 9月 2日 (木) 13:15:20 JST
初めて投稿させていただきます。
坂野@PCWです。
Namazuの検索結果に一部障害が発生しております。
ご教授宜しくお願い致します。
現在以下のような環境でNamazuを動作させています。
[環境]
・OS Windows2000Server SP3
・Webサーバ IIS5.0
・namazu 2.0.12
・kakasi 2.3.4
・Perl ActivePerl5.6.1
・ネットワーク LAN内で使用
・HTMLファイルのみ検索対象 ただしフォルダ内にPDF等他のファイルあり
・1時間毎にバッチのタスク処理にてインデックスの更新をしている
・webのrootはE:\wwwroot
・namazuのインデックスはC:\namazu\var\namazu\index配下のサブフォルダ
・namazu.cgi.exeはC:\cgi-bin配下
[現象]
・約2GBのデータをインデックス化し検索できるようにしています。
・運用を続ける中で検索結果が正常に出ないファイルが出てきました。
検索結果に存在しないアドレスが表示されます。
ただし、すべてのファイルではなくあくまで一部のファイルが該当します。
・通常検索結果はHTMLファイルのタイトルとフルパスのアドレスが表示されると思い
ますが、
正常に出ないものはタイトルはファイル名(xxxxxxxx.htmなど)、
フルパスのアドレスは無意味なアドレスが表示さます。
・異常検索結果のファイル名はサーバに存在しますがアドレスは存在していません。
・異常な検索結果のタイトル、パスにマウスのカーソルを当てると
http://(サーバのIPアドレス)/cgi-bin/xxx.htm等が表示されます。
ただし、xxxはファイル名とはまったく関係ないです。(概ね3文字)
・namazu.cgi.binを配置しているのはc:\cgi-binですが、webの仮想ディレクトリに
cgi-binはないため、異常な検索結果を選択すると「見つかりません」と帰ってき
ます。
・検索結果が異常になっているファイル中に検索語句の文言が含まれています。
[対処操作]
・インデックスが肥大化していたため、一度消去して再作成しました。
> 結果変わらず、異常な検索が表示されます。
・検索異常になっているファイルの含まれているサブフォルダを対象にインデックス
を
作成しました。サイズは約1.5GB弱。オプションに-U使用しました。
> 検索が正常に行えるようになりました。
・mknmzでインデックス作成時に--excludeを使い上記のサブフォルダを除いた他のサ
ブフォルダの
インデックスを作成しました。サイズは約500MB。
> 検索結果が異常になるファイルがでました。オプションに-U使用しました。
・さらに異常になるファイルを特定し、そのサブフォルダのインデックスを作成しま
した。(約50MB)
> 検索が正常に行えるようになりました。
検索結果に異常が発生してからいろいろと検証しているのですが、
上記の対処操作では永久ループをたどってしまいそうで解決できそうにないです。
以前データサイズが4GBだったものを1GBずつに分けてインデックスを作成したら、
検索が行えるようになったという事例があったと思うのですが、
500MBのデータでインデックスを作成しても障害発生するので
それも違いそうです。
この障害の原因・解消方法等ご存知の方いらっしゃいましたら
ご教授宜しくお願い致します。
Namazu-win32-users-ja メーリングリストの案内