Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: PDFの日本語タイトルが表示されない



寺西です。

"shima@xxxxxxxxxxxxx" wrote:
> 
> XPDFを利用してNamazuでPDFの検索を行っています。過去のメイルにも
> 同じような質問がありましたが、パッチを適用しても現象が変わらず質問
> してみました。

どのパッチでしょう。

> 現象としましては、PDFファイルの概要(pdfinfo)で取得する値が全文検索
> タイトルに表示されないというものです。自分で検証した内容を記載します。

何も表示されませんか? <unicode> と表示されますか?

システムに古い xpdf がインストールされており、複数の pdfinfo が
存在するということはありませんか?

> pdf.plの内容を見てみたらpdftotextの場合は、エンコードが自動的にセット
> される様子でしたので問題なしと判断しました。次にpdfinfoのところでエン
> コード指定がされていない様子だったので「-enc EUC-JP」を追加しました。
> これで期待通りの動作をするかと思いましたが、やはり日本語のプロパティ
> を設定しているpdfファイルのタイトルが表示されませんでした。

「-enc EUC-JP」が付いていないということは、最新の pdf.pl ではない
ですね。これで直るかどうか分かりませんが、以下の最新版 1.22.4.8 の 
pdf.pl を使うとどうなるか試していただけませんか?
# もっとも 2.0.12 用ではないので、そのまま使えないかもしれないが、
# たぶん大丈夫なはず。

http://cvs.namazu.org/namazu/filter/pdf.pl?rev=1.22.4.8&only_with_tag=stable-2-0&content-type=text/vnd.viewcvs-markup

また、次の acrobat4.pdf ファイルを処理した時は正しくタイトルが設定
されているかご確認ください。

http://cvs.namazu.org/namazu/tests/data/ja/acrobat4.pdf?only_with_tag=stable-2-0

acrobat4.pdf は正しくタイトルが表示できるが、お手持ちの PDF 
ファイルはダメだということでしたら、未知の問題かもしれません。
その場合は、症状が再現できる PDF ファイルをご用意いただけると、
調査することが可能かと思います。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E