Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: 要約にsubjectを含まない方法-具体的な記述方法?



寺西です。

Acclub wrote:
> 
> > ここでは HTML についての改造方法を示します。
> > html.pl の weight_element() で $$headings に追加する部分を改造
> > すれば良いでしょう。$element が TITLE なら追加しないという処理を
> > 加えれば目的は果たせるものと思います。

嘘でした。
ちょっとテストしたところ、根っこが深くて簡単には改造できそうに
ありませんでした。

そもそも subject(TITLE) の文字列は summary には含まれていませんでした。
# これは、そうあるべきです。

> 2. Namazu: FAQ (スコア: 87)
> 著者: webmaster@xxxxxxxxxx
> 日付: Fri, 30 Nov 2001 19:12:17
> Namazu: FAQ 目次 Namazu 2.0に関するよくある質問、ありそうな質問と

と subject の文字列が summary に含まれるのは、subject と同じ文字列
が本文に含まれているためでした。

本文に含まれる文字列は <H1> タグで囲まれているので
--no-heading-summary で削除できそうに思いますが、そうはいかない
のです。

内部的には summary は、$heading と $contref を繋いだ文字列の
先頭部分です。--no-heading-summary をつけると、$heading に
問題の文字列は含まれませんが、$contref に含まれるため、
結果として summary に現れます。

<H*> タグで囲まれた文字列を $contref に含めないようにすることで、
summary から消すことはできますが、検索対象からも外れてしまいます。
そのため、この対処方法もあまり良いものではありません。

> フィルタの改造で対応が可能とのこと、希望が沸いてきました。

変に期待を持たせてすみません。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E