Namazu-win32-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Index作成に関して



佐藤さん、こんにちは、関塚です。

> "[" の文字列がファイル名のどこで出現しても検索対象外
> とすべく、$DENY_FILEで指定しようとしているのですが、
> 「\Q[\E\.doc」など色々試しているのですが、なかなか

私も正規表現は詳しくないのですが、
「オープンソースソフトウェアによる全文検索・データベースWebの作り方」
という書籍の44頁によると、windows環境では次のように書くとあります。

mknmz --allow=".*\.txt|.\.doc" c:\data
(拡張子.txtと.docのファイルを対象とする)

正規表現にもヴァージョンというか、いろいろ種類があるようです。
「\Q」によるメタ文字の打ち消しは、ものによっては対応してないのかも。

mknmz --deny="\[.*\.doc|.*\[.*\.doc|.*\[\.doc" c:\data

とかで如何でしょう。見当違いだったらすいません。

ps
状況がよくわかりませんが、ルールを作ってファイルネームをツールなどで
適当にリネームしてしまった方が検索に含まれるので良いでは?