Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: bug? "mknmz --html-split"



><a name="" ←これ
>href="http://cclub.cc.tut.ac.jp/~hirata/diary/">
>
> name の value に何も与えられていないのが問題でしょう。試しに、name に
>適当な文字列を与えて実験してみたら(name="hoge"にしてみた)、正しくイン
>デックスを更新することができました。

ちょっと古い話ですが
html-split.plにおいて

(["']).+?\5)[^>]*>(.*?)</a>                  # 5,6
↓
"[^"].*?"|'[^'].*?')[^>]*>                   # 5,6 -> ()


write_partial_file($1, $4, $6, $id++, \%info)
↓
write_partial_file($1, $4, "", $id++, \%info)

とやるとうまくいくようになります。
結果的に分割された一つ一つのhtmlは変ですが
uriに改行が含まれるような処理のされ方はされなくなります。