Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: namazu での PDF 検索について



竹内です。

色々とアドバイスありがとうございます。

♪xpdf(pdftotextはこれに含まれる)の方には pdfinfo という
♪コマンドがあり、
♪
♪% pdfinfo acrobat4.pdf
♪Title:
♪Subject:
♪Keywords:     namazu test Acrobat4
♪Author:       test@xxxxxxxxxx
♪Creator:
♪Producer:     Acrobat PDFWriter 4.0 Windows
♪CreationDate: 20000215090710
♪ModDate:      20000215091117+09'00'
♪Pages:        1
♪Encrypted:    no
♪Linearized:   yes
♪
♪というような出力が得られます。日本語に対応していれこれを
♪使う方がすっきりするのですが残念です。
♪
 pdfinfo、なんとなく役に立ちそうなきがするのですが
残念ですということは、日本語対応されていないのですか?

やはりpdftotextで-eucjpか-rawで変換した1行目をだす
方法で作業を進めていった方がよいのでしょうか?
-eucjpと-rawでは変換されたファイルの1行目がちがいます。
-eucjpではPDF本文の一番始めにかき出された一文のようですが
-rawですとどこに設定された文章なのかわからないのですが
なんだか使えそうなちょうど良い一文が出力されます。
ですので-rawにしようかと思ったのですが、
設定個所がわからないのじゃあまり良い方法ではないと思うので
やぱり-eucjpで変換した一行めを出力するようpdf.plをカスタマイズしてみます。
ありがとうございます。


-------------------------------------------------------------
	アルゴ  竹内 晴恵(arg00032@xxxxxxxxxxxxxxxxxx)
                          内線:2422
-------------------------------------------------------------