Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

【まとめ】インデクス化の除外方法



おおもと投稿者の磯部です。
廣瀬さん、レスありがとうございます。

   "HIROSE Yoshihide <yoshihide@xxxxxxxxxx>" wrote:

> > あ、でもサーバ上でしか作れないCGIが吐き出すHTMLファイルも
> > インデックス化しないといけないので、ちょっと惜しいですねぇ。
> 
> おっしゃっていることが、今一つわからないのですが
> mknmzではスタティックなファイルのインデクスしか
> できません。ので、cgiがダイナミックに生成するhtml
> は、サーバ上であろうがローカルだろうがインデクスは
> 不可能です。

すみません。舌足らずでした。
サーバ上で動作している(ローカル(私はWin32)では動作できない)
CGIが吐き出す静的HTMLファイルもインデックス化したいのです。
となると、結果として出力されたHTMLファイルもFTPでダウンロードして
Win32上でインデックス化して。。。という過程を踏めばいいということですね。


> なので、
>  1) サーバ上のすべてのドキュメントをftpでローカルに保存
>  2) インデクスから除外したいファイルを削除
>  3) windows版namazuをダウンロードしてインデクスを作成
>  4) つくったインデクスをftp
>  5) .namazurcでINDEX,REPLACEを適切に指定
> すればいいでしょう。

Win32版Namazuでも大丈夫と言うことなので、
この方法が安全な方法ではありますね。
ただ、これを毎晩(とか毎朝とか)一回ずつやるとなると
手動ではちょっと体が持たないですね。
何か、ユーティリティか自動化スクリプトを用意しないと。。。(^_^;


==【まとめ】=========================================================
皆様から、たくさんのレスをいただきありがとうございました。
色々なご助言をいただき、大変勉強になり感謝しております。
総合してみると、以下のような選択肢がありそうですね。

	1. サーバ上のファイルをダウンロードし、インデクス化から
           除外したいファイルを削除して、ローカル(Win32でも
           バージョンが同じなら可)でインデックス化して、
           インデックスをアップロード。

	2. .namazurc内で、インデクス化したくない(例:/cgi-bin/)を
           Replace文で別のところに飛ばす。

	3. Namazuがインデックス化対象とするファイル拡張子(*.htmとか)
           以外の拡張子にしてしまう。

	4. NMZ.r を見て、インデクス化したくない(cgi-bin)のファイルが
           N 番目にあったら、NMZ.t のオフセット 4*N バイト目からの
           4 バイトを ff にする。
=======================================================================

私にとっては、すぐに対応できるものもありますし、
Namazu & CGI 若葉マークの私にはちょっとがんばらないと
できないものもあります。

ですので、対応可能なものから、徐々に対応していって、
インデクス化されたくないファイルを一掃するというところまで、
徐々に持っていこうと思います。

皆様、どうもありがとうございました。
今後ともどうぞよろしくお願いします。

-----
磯部克司
Katsuji Isobe <zak14942@xxxxxxxxxxxxxx>