[Namazu-users-ja 381] Re: pdfの検索結果について

Tadamasa Teranishi yw3t-trns @ asahi-net.or.jp
2005年 5月 13日 (金) 14:52:54 JST


寺西です。

norizo a wrote:
> 
> タイトル表示の件ではお世話になりました。表示することができました。

具体的には何がどうで、どう対処して表示することができたのでしょうか?

http://www.namazu.org/ml.html#give-and-take
http://www.namazu.org/ml.html#thanks-only

を再度読み直してください。

> タイトル表示で、「橡」が表示されてしまいます。
> 「橡」を表示させないようにするには、どこを修正するとよろしいでしょうか?
> 
> 検索結果
> 1. 橡株式会社三徳 (スコア: 3)
>     著者: 橡
>     日付: Wed, 11 May 2005 12:03:07
>     株式会社 三徳 求 人 票 2006年 度(成18年)卒 業 予 定者 向 け求・・・
> 
> よろしくお願いいたします。

xpdf の問題では?

$ pdfinfo PDFファイル

としても表示されるのではありませんか?

xpdf を修正するのが本筋ですが、
ADHOC な対処方法としては、filter/pdf.pl の次のところを修正して
「橡」を取り除くという手はあります。

sub filter の中の

        if ($cont2 =~ /Title: (.*)/) { # or /Subject: (.*)/
            $fields->{'title'} = $1;

の後に
            $fields->{'title'} =~ s/^\s*\xc6\xcb//s;
を追加

        if ($cont2 =~ /Author: (.*)/) {
            $fields->{'author'} = $1;

の後に
            $fields->{'author'} =~ s/^\s*\xc6\xcb//s;
を追加
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns @ asahi-net.or.jp
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E




Namazu-users-ja メーリングリストの案内