Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: robots.txtをインデックスから除外するには?



こんにちは白井です。

From: Takuya Tsumura <tsumura@xxxxxxxxxxxxxxxxxx> さん曰く
Subject: [namazu-users-ja] robots.txtをインデックスから除外するには?
Message-ID: <20020916113914.1305@xxxxxxxxxxxxxxxxxxxxxxxxxxx>
Date: Mon, 16 Sep 2002 20:39:13 +0900

> Webサーバのドキュメントルートにrobots.txtを置いています.
> 
> ドキュメントルートと複数のディレクトリをまとめて1つの
> インデックスを作成しているのですが,mknmzを実行する際に
> -Fオプションを使用しているため,
> /usr/local/etc/namazu/mknmzrcの以下設定が無効になるようで,
> robots.txtが上記インデックスに含まれてしまいます.
>     $DENY_FILE = ".*\\robots.txt|.*\\.pdf";
> 
> 運用上,-Fオプションをはずせないのです.
> この状態のままでrobots.txtをインデックスから除外する
> 何か良い方法は無いでしょうか?

あれ?? と思い試してみたのですが、$DENY_FILE と
-F(--target-list) は両立します。

× $DENY_FILE = ".*\\robots.txt|.*\\.pdf";
○ $DENY_FILE = "robots\\.txt|.*\\.pdf";

かな。しかし、target-list を使うなら、最初からそのファイルから
robots.txt を削除しておいた方が良いのでは?

-- 
白井秀行 (mailto:shirai@xxxxxxxxxxxxxxxxxxx)