Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: filter/macbinary.pl試用結果



寺西です。

# 何だかんだ書きましたが、結局こうでした。

Tadamasa Teranishi wrote:
> 
> 一方、空要素の <meta />, <br />, <hr />, <img /> といった、XHTML 
> タグについては、W3C の仕様書で後方互換性を保つ為に示されているもの
> で、HTML 解釈ブラウザのためにそう書くことになっています。
...
> このため、HTML を解釈する部分ではこれらのタグに対応しておかない
> といけないのは確かです。(これを解釈しないからといって、たぶんバグ
> とは言えないとは思いますが、実用的ではないでしょう。)

少なくとも開発版では <br /> や <img /> は削除されるようです。
つまり、既に対応済みでした。

きちんと確認していませんが、remove_html_elements の前の処理である
normalize_html_element でうまく normalize されて、
remove_html_elements で削除されるようです。

(<br/> はダメですが、これは HTML 解釈ブラウザで解釈されないと
されているので、HTML 解釈ブラウザと同じ振る舞いといえるでしょう。)
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E