Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: namazu での PDF 検索について



寺西です。

arg00032@xxxxxxxxxxxxxxxxxx wrote:
> 
> 現在namazuでの検索でPDFファイルを検索対象としているのですが
> 検索結果がファイル名となってしまいます。

仕様ですね。というと冷たいのですが。

> 検索対象としているPDFファイルには全てプロパティに
> 題名(タイトル)を設定してありますが
> 検索結果のタイトルとしては出てないようです。
...
> PDFフィルタ:pdftotext Ver 0.91

pdftotext は PDF ファイルから文字情報をテキストファイル
に取り出すプログラムです。
取り出されたものには、タイトルも含まれるのかもしれませんが、
どこがタイトルなのかは分かりません。単なるテキストですから。

というわけで、pdftotext に タイトルを取り出すオプションが
あるとか、PDF ファイルから簡単に直接タイトルを取り出すことが
できるのであれば、namazu で対応することは可能になるかと
思います。それが簡単にはできないのであれば、対応は難しい
でしょう。
perl のライブラリで PDF を扱えるものがいくつかありますが、
それらでできるのであれば、簡単に解決できるかもしれません。
# 何方か、そういう情報に詳しい方、いらっしゃいますか?
--
寺西