Namazu-win32-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

--html-split で得られるタイトル



田村と申します。
いつもお世話になっております。

mknmz で --html-split オプションを使い、HTML文書をアンカータグ単位で
分割させてインデックスを作成しているのですが、検索結果を示すタイトルが
タグに囲まれた中味をどのように記述しているかによって変わるようです。

HTML文書の
<TITLE>foo</TITLE> として、以下の4つのパターンがあります。

<A NAME="bar">[bar]</A> だと
[1] foo:[bar](スコア....)

<A NAME="bar"></A> (中味なし)だと
[1] foo:bar(スコア....)

<A NAME="bar"> (終タグなし)だと
[1] foo:bar(スコア....)

<A NAME="bar"><!-- --></A> (中味はコメント)だと
[1] NMZ.partial.XX.tmp(スコア....)

# XX は数字
# スコア... は斜体字

問題は4つ目のパターンで、開始タグと終タグの間がコメントだった場合、mknmzで
一時的に使用しているファイル名がタイトルになってしまいます。
しかし、タグ間に何も書かなければ NAME 属性の値がタイトルに含まれます。

4番目のパターンが2番目のパターンと同じになるように、mknmz
(あるいは htmlsplit.pl ?)を修正しようと思いますが、
どこを修正してよいのかわかりません。

#Java のドキュメントなんかは正に4番目のパターンで書かれています。

当方の環境は Win2K + Apache 2.0.40 + Namazu 2.0.12 です。

どなたか、ご教授の程よろしくお願い申し上げます。

(株)島精機製作所 システム開発部
田村孝彦 (Takahiko TAMURA)
takat@xxxxxxxxxxxxxxxx
TEL +81-73-474-8220
FAX +81-73-474-8276