Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: HTML splitting



>>>>> In [namazu-devel-ja : No.00140] 
>>>>> “高林” = Satoru Takabayashi <satoru-t@xxxxxxxxxxxxxxxxxx>さん
高林> 実装して commit しました。が、まだ実験段階です。

高林>   * Namazu の doc/ja でしかテストしていない
高林>   * インデックスの更新は考慮していない

高林> HTMLの分割処理を有効にするには --html-split オプションを指定
高林> します。

気がついたとこだけ。少ししか試していません。

1. htmlsplit.pl が make install で install されなかった。

2. <A NAME=".."> </A> という大文字にも対応してほしい。

3. htmlsplit.pl の 以下の正規表現は mknmzrc で設定できるとい
いかも。

    $cont =~ s/(<a\s[^>]*href=(["']))#(.+?)(\2[^>]*>)/$1$3.html$4/g; #'
$cont =~ s{\G(.+?)<a\s[^>]*name=(["'])(.+?)\2[^>]*>(.*?)</a>} #'

4. name の数に制限がある?

2 files are found to be indexed.
/home/kose/Namazu/tmp/NMZ.partial.57.tmp: Too many open files at /usr/local/share/namazu/pl/htmlsplit.pl line 119, <GEN5> chunk 1653.

と止ります。

高林>   * Namazu の doc/ja でしかテストしていない

http://www.sodan.org/%7Epenny/Meadow/FAQ-Meadow-ja.html

のようなのにも使いたいなぁ。

高林>   * インデックスの更新は考慮していない

2回目は

kose(^.^)casper> mknmz --html-split ../src
/home/kose/Namazu/src/index.html	TOC1 was deleted!
/home/kose/Namazu/src/index.html	TOC2 was deleted!
/home/kose/Namazu/src/index.html	TOC3 was deleted!
/home/kose/Namazu/src/index.html	Webtree was deleted!
/home/kose/Namazu/src/index.html	ChangeLog was deleted!
/home/kose/Namazu/src/index.html	fan_letter was deleted!
[Base]

のようになっちゃいますね。

ファイルのタイムスタンプが更新されたら INDEX は作り直される
んですよね。それでいいんじゃないかな。
--
こせき @ Emacs のページ作成中
http://www.NetLaputa.ne.jp/~kose/Emacs/
kose@xxxxxxxxxxxxxxxxxx