Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: robots.txtをインデックスから除外するには?



From: Takuya Tsumura <tsumura@xxxxxxxxxxxxxxxxxx> さん曰く
Subject: [namazu-users-ja] Re: robots.txtをインデックスから除外するには?
Message-ID: <20020917063436.16571@xxxxxxxxxxxxxxxxxxxxxxxxxxx>
Date: Tue, 17 Sep 2002 15:34:36 +0900

> >× $DENY_FILE = ".*\\robots.txt|.*\\.pdf";
> >○ $DENY_FILE = "robots\\.txt|.*\\.pdf";
> 
> 上記○をmknmzrcに設定し,インデックスを削除し新たに作り直しました.
> インデックス作成時のログを見ると,以下のようになっており,
> robots.txtがインデックスに含まれてしまっています.

仕様だと思いますが、

> /usr/local/bin/mknmz --robots --target-list=<次行と継続してます>
> /home/www/cgi-data/jwri-info/index_list.txt --deny='robots\\.txt|.*\\.pdf'

--deny をつけると mknmzrc に書いた $DENY_FILE は無視されます。そ
して、オプションの --target-list と --deny は両立しなようです。

津村さんのスクリプトでは上記の組合わせになっているので mknmzrc
の $DENY_FILE が無視されているのでしょう。だから、

/usr/local/bin/mknmz --robots \
 --target-list=/home/www/cgi-data/jwri-info/index_list.txt

だけにして --deny オプションを消せばうまくいくと思います。

> もしかすると,mknmzを実行する際に/usr/local/etc/namazu/mknmzrcを
> 読みにいけてないだけかもしれません...

ちゃんと読みに行っているかどうかは mknmz --show-config でわかる
ので確かめると良いです。

-- 
白井秀行 (mailto:shirai@xxxxxxxxxxxxxxxxxxx)