Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: PDF のプロパティを検索する方法



永野です。

> > プロパティ情報(タイトル/サブタイトル/作成者/キーワード)での
> > 検索は可能でしょうか?
> 
> きちんとした回答ができませんが。
> まず、pdftotext で出力されるテキストにプロパティ情報が出力されて
> いるでしょうか? 確か含まれていないと思います。
> ですので、検索できないということにないます。(少なくとも
> 今のところ)

プロパティ情報は出力されませんでした。

> プロパティ情報が出力されていれば、検索そのものは可能でしょうが、
> タイトルに XXXX が含まれるものといった個別の検索まではむずかしい
> でしょう。
> 
> pdfinfo というコマンドでは、
> 
> % pdfinfo acrobat4.pdf
> Title:
> Subject:
> Keywords:     namazu test Acrobat4
> Author:       test@xxxxxxxxxx
> Creator:
> Producer:     Acrobat PDFWriter 4.0 Windows
> CreationDate: 20000215090710
> ModDate:      20000215091117+09'00'
> Pages:        1
> Encrypted:    no
> Linearized:   yes
> 
> というような出力が得られます。日本語に対応していれば
> 良いのですが、残念ながら対応していません。
> 
> 英語でよければ、この出力を検索するようにフィルタを作成すれば
> 望みはかなうでしょう。
> --
> 寺西

日本語で検索したいので、今回はあきらめます。
ご協力ありがとうございました。