Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

page /w noindex has indexed



もりもとです。
ずばっとパッチを作って付けたいけど、ごめんなさい、とりあえず報告のみ。

● 現象

NOINDEX 指定のページが mknmz 対象になってしまう

● 解説

<HEAD> 内に <META NAME="ROBOTS" content="NOINDEX"> があり、
かつ <A NAME="foo"></A> 指定のあるページを
--html-split を指定して mknmz すると、
--robots も指定してあるにかかわらず、
最初の A NAME="" 以降のセクション? がインデキシングされてしまう。

<A NAME="foo"> で HTML を内部的に複数のファイルに分割した後、
# htmlsplit::split() ?
そもそもファイル自体が NOINDEX であることが継承されてない/無視されている?

● バージョン

namazu 2.0.3 (on Linux 2.2.14, libc5, Slackware 3.x あたり)

.. 森本 淳 (Jun Morimoto) ...........................................
.. morimoto@xxxxxxxxxxxxxxxxxx http://www.toybox.ne.jp/~morimoto/ ...