[Namazu-win32-users-ja 1037] Re: HTMLのhタグ部分がインデックスされない問題

Tadamasa Teranishi yw3t-trns @ asahi-net.or.jp
2007年 10月 5日 (金) 21:49:58 JST


寺西です。

Kuroda wrote:
> 
> 2.問題の状況
>     HTMLファイルのhタグの部分がインデックスされません。mknmz(その後
>   searchsで検索)およびnmzcatで調べましたが、hタグの部分が取り出され
>   ないようです。

どうやら
  -x, --no-heading-summary HTML のヘディングによる要約作成を行わない
に関するバグのようです。

> [実例]
>     1)添付ファイル「test1.htm」では、<h5>〜</h5>の部分がインデックス
>       されません。

-x を付けると回避できますが、本来の -x オプションの動作と逆な気が
します。
これについては調べて、次のバージョンでは直したいと思います。


以下、余談ですが

>         注)ウェブ画面の段落内で文字サイズを変更させるため、hタグを
>           使用しています。本HTMLでは省略していますが、実際にはCSS

<Hn> タグは見出しを指定するタグです。

 > 見出しの順序や付け方はHTML DTDで定められてはいませんが、その文書を
 > 別の形式に変換する際に問題にならないようにするために、(例えばH1
 > からH3というように)レベルを飛ばすのは望ましくありません。 

となっており、本来、文字サイズを変更する用途に使うべきではありません。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns @ asahi-net.or.jp
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E




Namazu-win32-users-ja メーリングリストの案内