Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: PDFの日本語タイトルが表示されない



> 寺西です。
> 
> "shima@xxxxxxxxxxxxx" wrote:
> > 
> > XPDFを利用してNamazuでPDFの検索を行っています。過去のメイルにも
> > 同じような質問がありましたが、パッチを適用しても現象が変わらず質問
> > してみました。
> 
> どのパッチでしょう。
以下のパッチです。
diff filter/pdf.pl ../../namazu.new/filter/pdf.pl
126c126,127
<           $fields->{'title'} = $1;
---
>             my $title = $1;
>           $fields->{'title'} = $title if ($title !~ /^ *$/);

> 
> > 現象としましては、PDFファイルの概要(pdfinfo)で取得する値が全文検索
> > タイトルに表示されないというものです。自分で検証した内容を記載します。
> 
> 何も表示されませんか? <unicode> と表示されますか?
何も表示されません。
> 
> システムに古い xpdf がインストールされており、複数の pdfinfo が
> 存在するということはありませんか?
確認しましたがありませんでした。
> 
> > pdf.plの内容を見てみたらpdftotextの場合は、エンコードが自動的にセット
> > される様子でしたので問題なしと判断しました。次にpdfinfoのところでエン
> > コード指定がされていない様子だったので「-enc EUC-JP」を追加しました。
> > これで期待通りの動作をするかと思いましたが、やはり日本語のプロパティ
> > を設定しているpdfファイルのタイトルが表示されませんでした。
> 
> 「-enc EUC-JP」が付いていないということは、最新の pdf.pl ではない
> ですね。これで直るかどうか分かりませんが、以下の最新版 1.22.4.8 の 
> pdf.pl を使うとどうなるか試していただけませんか?
> # もっとも 2.0.12 用ではないので、そのまま使えないかもしれないが、
> # たぶん大丈夫なはず。
> 
> http://cvs.namazu.org/namazu/filter/pdf.pl?rev=1.22.4.8&only_with_tag=stable-2-0&content-type=text/vnd.viewcvs-markup
出てきました!!
有難う御座いました。
> 
> また、次の acrobat4.pdf ファイルを処理した時は正しくタイトルが設定
> されているかご確認ください。
> 
> http://cvs.namazu.org/namazu/tests/data/ja/acrobat4.pdf?only_with_tag=stable-2-0
> 
> acrobat4.pdf は正しくタイトルが表示できるが、お手持ちの PDF 
> ファイルはダメだということでしたら、未知の問題かもしれません。
> その場合は、症状が再現できる PDF ファイルをご用意いただけると、
> 調査することが可能かと思います。
> -- 
> =====================================================================
> 寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
> http://www.asahi-net.or.jp/~yw3t-trns/index.htm
> Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E
> 
>