Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: 特定の領域をインデックスからはずしたい



廣瀬様 ありがとうございます!

On Mon, 16 Feb 2004 05:38:31 +0900
Mr/Ms HIROSE Yoshihide  wrote:
> ご希望の動作かどうかわかりませんが、html内で指定した部分を
> インデックす対象に設定、もしくは除外するようなパッチを作ってみました。

これでほぼ満足なのですがテスト結果のみ報告させていただきます。
.mkmzrcに次の記述を加え
$INDEX_PAT = "<!-- idx -->(.*?)<!-- /idx -->";
$SUMMARY_PAT = "<!-- sum -->(.*?)<!-- /sum -->";
下記ページにタグを埋め込んでみました。
http://narf.alcnet.jp/aisatu.htm
※制作中のサイトにつきアクセス制限をかけてます。
ユーザー名 login パスワード なし
でおはいりください。

(1)<!-- idx --><!-- /idx -->で2つの範囲を指定すると先に指定した
範囲は無視される。
※具体的にはタイトル枠の中の「ごあいさつ」の部分と「日本でも」〜
「@xxxxxxxxx」までの本文の部分を指定すると後者のみが有効になりました。
でもこれはHTMLの構成を変えることで解決できます。

(2)<!-- sum --><!-- /sum -->を指定するとかこまれた部分の単語が検索が
できなくなる。
※でも、前述のこれ用に作ったNMZ.field.summary,NMZ.field.summary.iを
このオプションなしでインデックスしたものに上書きコピーすることで
これは解決できます。

(3)<!-- sum --><!-- /sum -->の範囲が短すぎるとHTMLのタグが入ることがある。
※上記ページでは最後の方の「インターネットによる・・」〜
「・・ソリューションを提案」を範囲にしています。
たとえば「競争力」として検索してみてください。

でもこれで当初の目的は十分達成でき満足しております。
寺西さん、廣瀬さんの両氏に感謝いたしますm(__)m

納富