Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: HTML-embedded language file support



  反応が遅くなりましたが、

<20011017175133G.hajime.baba@xxxxxxxxx>の記事において
hajime.baba@xxxxxxxxxさんは書きました。

>> ASP,JSP,PHP,VBScript,JScript,JavaScript などといった HTML 埋め込み
>> 型のサーバ/クライアントサイド言語のプログラムロジック記述部分を、
>> 検索対象や要約作成対象から外すために、filter/html.pl に以下のよう
>> な変更を加えるといいのではないかとおもうのですがいかがでしょうか。

  良いのではないでしょうか。

>> sub add_magic ($) {
>>     my ($magic) = @_;
>> 
>>     $magic->addFileExts('\\.asp$', 'text/html; x-type=asp');
>>     $magic->addFileExts('\\.jsp$', 'text/html; x-type=jsp');
>>     $magic->addFileExts('\\.php[3s]?$', 'text/html; x-type=php');
>>     return;
>> }
>> 
>> というようにしてもうまくいかないのはなぜ? おおむね text/html に
>> 自動判定されてしまいます。embedded_filter() は通ってるんですが。

  load_document() 内で、特定の種別以外は checktype_byfilename の評価よ
りもchecktype_magic の評価を優先しているからだと思います。拡張子による
判別は補助的なものという位置付けにしているので、このようになっています。

  先頭十数行ぐらいをみた時に contents で判別可能なら、addSpecials で
判別するための regex を与えるのが良いと思います。
-- 
野首 貴嗣
E-mail: knok@xxxxxxxxxxxxx
	knok@xxxxxxxxxx / knok@xxxxxxxxxx