[Namazu-win32-users-ja 1040] Re: HTMLのhタグ部分がインデックスされない問題

Kuroda sanseikai @ nifty.com
2007年 10月 5日 (金) 22:08:52 JST


臼田 様
  早速のご指導ありがとうございました。

>詳しく調べていませんが、おそらく
><h5>と</h5>の間にある本文中に<br>タグがあるため
>filter/html.pl の
>weight_element, weight_element_sub 内の正規表現処理で
>間違った処理がされていると思われます。
>可能であれば修正をすることになります。
==>
<br>を<br />に変更しても、<br>を削除しても改善しませんでした。従って、
<br>タグは無関係のようです。


>HEAD 版の html.pl では正規表現処理でなく
>HTML::Parserを使用することもできるため
>当面、これを使えば問題なく処理できるかと思います。
>http://cvs.namazu.org/*checkout*/namazu/filter/html.pl?rev=1.55
>から入手してc:\namazu\share\namazu\filter\html.pl と置き換えて使って
>みてください。
>(別の問題が起きるかも知れませんので元のファイルは別名で
>コピーして残しておいてください)
==>
教えていただきました通りにhtml.plを置き換えましたら、解決しました。
後のメールで寺西様が上記のhtml.plに懸念を示されていますが、当面は
この置き換えを採用させていただきます。

どうもありがとうございました。


−−−−−−−−−
    黒田 英夫
−−−−−−−−−



Namazu-win32-users-ja メーリングリストの案内