Namazu-win32-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: HTML化されたOffice文書のタグ抜き方法は?



とうぼうです。

> NMZ.result.normalをすべて埋め尽くしてしまうのですが、
> 何かうまい打開策はないでしょうか?

何らかのロジックでもって、当該HTMLファイルから
サマリーと認識できる箇所の先頭何バイトかを引っ張ってきて、
NMZ.result.normal.ja の ${summary} に放り込んで
表示しているだけだと思いますので、
現状では致し方ないのではないかと思います。

どうして <p:slide のところからがサマリーと
なっているのかは、詳しくないのでよくわかりません。

-- 
TOUBOU Junichi <toubou-junichi@xxxxxxxxxxxx>