Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: PDF ファイルの T itle 取得



星野です。

teranisi@xxxxxxxxxさんの<3A21B426.219EA54A@xxxxxxxxx>から
(Mon, 27 Nov 2000 10:08:54 +0900)
>> やはり、うまくタイトルを取得できないPDF文書があるようで
>> す。
>これは、コマンドラインから pdfinfo を実行した場合には、
>タイトルを取得できているのでしょうか?
># この時に取得できていないのでしたら、どうしようもないですけど。

 偶然、取得できる文書が手元にあったのです。ところが、色々
なPDF文書を集めて実験してみたら全てアウトだった、という
事です。

 現在、pdf2txt のスクリプト(sub read_info 部分)を参考にし
て、pdfinfo.plというものを作成中です。

#PDF文書をstrings コマンドに通して/Titleなどを取得する
#というものです。

 とりあえず、アウトだったPDF文書のタイトルなどが取得で
きるようになりました。

 検索結果もほぼ思ったとおりのものになっているようです。


-----
Hisashi Hoshino
mailto:panda@xxxxxxxxxxxx