Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

ミラーリング時の更新時刻保持について



因幡@武蔵大と申します。

現在、以下のようなサーチエンジンをNamazu-2.04 + wget-1.5.3で作成しようと
奮闘しています。
1.事前に承諾をもらっているWebサイトをwgetでミラーリング
2.mknmzでインデックス化
3.namazuで検索

ここで、一つ問題が発生してしまいました。
wgetでミラーリングする際、タイムスタンプが取得時刻になってしまうため、
Namazuの出力時、日付でのソートが出来なかったり、不正な(ミラーリング元の更
新時刻とは異なる)日付が出力されたりで困っています。

Namazuの問題というよりはwgetの問題(私が使い方を知らないだけ)という気もす
るのですが、このMLであれば同様の使い方をされている方もいらっしゃるかと思
い、こちらに投稿させていただきました。

解決のためのポインタなど、ご指摘いただければ幸いです。

なお、現在cronで実行させているコマンドは以下の通りです。

#ミラーリング
00 22 * * *     wget -b -m http://www.tk.airnet.ne.jp/tet/index.html -A
*.htm*,*.shtm* -P /home/tet/mirror/tet

#インデックス作成
45 22 * * *     mknmz -O /home/tet/index/tet /home/tet/mirror/tet

※ディレクトリ名などは架空のものです

=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=
 因幡哲男    (Tetsuo Inaba)
 tet@xxxxxxxxxxxx
 http://www.tk.airnet.ne.jp/tet
=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=