Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: 検索のタイトル表示



今尾です。 早速にありがとうございました。

説明が不十分で大変申し訳ありませんでした。
基本的にはそのとうりですが、ページの下部にある定型部分を
インデックスの対象から外すため、html.pl フィルターに変更を
加えて使っていたため、少し事情が違っていたようです。

----- Original Message ----- 
送信者 : "Tadamasa Teranishi" <yw3t-trns@xxxxxxxxxxxxxxx>
宛先 : <namazu-users-ja@xxxxxxxxxx>
送信日時 : 2003年7月28日 19:47
件名 : [namazu-users-ja] Re: 検索のタイトル表示


> 
> もし、そうなら例えば次のような場合は
> 
> <TITLE><abc></TITLE>
> 
> これを
> 
> <TITLE>&lt;abc&gt;</TITLE>
> 
> と書き直せば、半角になりますが表示されるのではないかと思います。
> 

半角でOKですので、これをヒントに少しフィルターを調べてみました。

下記、タイトルを取り出す部分? …4行目でタイトル無しと
判断されファイル名が表示されたようです。

sub get_title ($$) {
    my ($contref, $weighted_str) = @_;
    my $title = '';
    if ($$contref =~ s!<TITLE[^>]*>([^<]+)</TITLE>!!i) {
        $title = $1;
        $title =~ s/\s+/ /g;
        $title =~ s/^\s+//;
        $title =~ s/\s+$//;
        my $weight = $conf::Weight{'html'}->{'title'};
        $$weighted_str .= "\x7f$weight\x7f$title\x7f/$weight\x7f\n";
    } else {
        $title = $conf::NO_TITLE;
    }
    return $title;
}

これを、下記のように変更して、とりあえずOKのようです。
    if ($$contref =~ s!<TITLE>(.+)</TITLE>!!i) {

半角ですと、HTMLタグと同じであるため、全角の方が扱いやすと
考えただけです。半角でかまいません。

寺西 様 とどろき 様  ありがとうございました。

---
Toshio IMAO imao@xxxxxxxxx