Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: namazu-bugs-ja#57 の件 + TITLE="foo" のバグ他



寺西です。

Tadamasa Teranishi wrote:
> 
> また、個人的には
> http://www.namazu.org/ml/namazu-ring/msg01326.html
> のような alt, summary, titile を切り出したくないことがありますので、
> そのような仕組みもあると良いかと思っています。

同様の内容で以下の投稿もありました。
http://www.namazu.org/ml/namazu-users-ja/msg02916.html

そこで、HTML タグの alt, summary, title 属性について、単語登録
しない機能をつけてみました。(stable-2-0 用のパッチです。)

内容)
・mknmzrc に $HTML_ATTRIBUTES を追加しました。
・$HTML_ATTRIBUTES のデフォルトは "ALT|SUMMARY|TITLE" で、
 指定した HTML タグの属性は単語登録されます。
・$HTML_ATTIBUTES に ALT, SUMMARY, TITLE 以外の属性を追加しても
  無視されます。
・$HTML_ATTRIBUTES から削除した属性については単語登録されません。
 3つの属性全てを単語登録したくない場合は、$HTML_ATTIBUTES = '';
  とします。
・$HTML_ATTRIBUTES から削除した属性については要約にも現れません。 

Index: filter/html.pl
===================================================================
RCS file: /storage/cvsroot/namazu/filter/html.pl,v
retrieving revision 1.32.4.5
diff -r1.32.4.5 html.pl
104,106c104,106
<     html::get_alt_attr($contref);
<     html::get_table_summary($contref);
<     html::get_title_attr($contref);
---
>     html::get_alt_attr($contref) if "ALT" =~ /^($conf::HTML_ATTRIBUTES)$/io;
>     html::get_table_summary($contref) if "SUMMARY" =~ /^($conf::HTML_ATTRIBUTES)$/io;
>     html::get_title_attr($contref) if "TITLE" =~ /^($conf::HTML_ATTRIBUTES)$/io;
Index: pl/conf.pl.in
===================================================================
RCS file: /storage/cvsroot/namazu/pl/conf.pl.in,v
retrieving revision 1.33.4.4
diff -r1.33.4.4 conf.pl.in
92a93,98
> #
> # This pattern specifies attribute of a HTML tag which should be 
> # searchable.
> #
> $HTML_ATTRIBUTES = 'ALT|SUMMARY|TITLE';
> 

-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E