[Namazu-users-ja 450] Re: 検索式に記号文字を使えるようにするには

"堅田 一夫" katada @ i-net.asahi.co.jp
2005年 7月 21日 (木) 10:16:41 JST


寺西様・臼田様

ご返答ありがとうございます。

スペースや改行といった普段何気にHTMLに入っているものでうまく
インデックスが作れないとは思いませんでした。
勉強になりました。


html.plフィルタを一度試してみようと思います。

ありがとうございました。

At 21:04 05/07/20, you wrote:
 >臼田です
 >
 >Tadamasa Teranishi wrote:
 >>
 >> HTML のタグ処理を完璧にしようとはしていないので、この問題は放置
 >> されるでしょう。(理由はわかっていますが...。)
 >> ただ、html.pl フィルタは、きちんとした HTML パーサを使ったものに
 >> 将来置き換える予定ですので、その時には解決するものと思います。
 >> --
 >
 >2.0.15には、入らないかもしれませんが HTML パーサを使うフィルタも
 >作成はしていますので、よろしければ試してください。
 >
 >http://cvs.namazu.org/namazu/filter/html.pl?rev=1.47&content-type=text/vnd.viewcvs-markup
 >から入手して
 >既存の filter/html.pl と置き換えて下さい。
 >(まだ十分なテストはしていないので、問題が生じた場合に備えて元のhtml.plの
 >バックアップはとっておいてください)
 >
 >HTML-Parser.pm と HTML-Tagset.pm のインストールも必要です。
 >インストールしていないと既存のフィルタと同じ動作をします。
 >http://search.cpan.org/~gaas/HTML-Parser/Parser.pm
 >http://search.cpan.org/~sburke/HTML-Tagset-3.04/lib/HTML/Tagset.pm
 >
 >臼田幸生
 >
 >
 >_______________________________________________
 >Namazu-users-ja mailing list
 >Namazu-users-ja @ namazu.org
 >http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja


========================
堅田 一夫
katada @ i-net.asahi.co.jp 





Namazu-users-ja メーリングリストの案内