Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: 定形部分を外す方法



冨樫@GTGSです。

>>> On Tue, 05 Feb 2002 17:29:05 +0900, 藤原 誠 / Makoto Fujiwara <makoto@xxxxx> said:

>   遅いとか、メモリの使用量の問題などで、これを C でもし書き
> 直すとすると、そういうようなちょっとした変更の可能性が捨てら
> れてしまってはこまるな、
>   でも Perl 路線をを維持すると、そういう「美しい」方向に行く
> と、ますます遅くなってしまうし

おっしゃることわかります。id 属性・class 属性は、body 要素内のほとんど
の子要素に指定できます。それらをすべてなめていったらとんでもないことに
なります。Perl には荷の重い仕事かもしれません。

ただし、(i) 任意の部分を検索対象からはずしたい (ii) 要約表示をコントロー
ルしたいという二つの目的を達成するためだけなら、例えば 処理対象の要素
を div と span に限定、属性は class のみを使うというようにすれば資源を
少し節約できると思います。

	<body>
	<div class="header">ヘッダなど</div>
	...
	<div class="summary">サマリ</div>
	...
	<div class="footer author address">フッタなど</div>
	</body>

藤原さんのコメントコントロール案と形式はほぼ同じです。

どちらにせよ仕様の議論がまだまだ必要ですね。改造のスケジュールは 2.1 
になってからのようです。

なお id 属性は name 属性と同様に --html-split の対象にして欲しいと思っ
ています。

--nobu