[Namazu-users-ja 1162] Re: mknmzにてPDFインデックス作成できない maybe copying protectionの表示

Tadamasa Teranishi yw3t-trns @ asahi-net.or.jp
2009年 8月 25日 (火) 04:15:30 JST


寺西です。

森田 光貴 wrote:
> 
> やはりPDFファイルはすべて変換できないようです。

そうですか、それならば

> 完全にこの結果からPDFファイルに問題があるのではなく
> 当方のxpdfの設定がおかしいとは思うのですが。。。

その可能性が高いですね。
 
> 念のためにpdftotextも実行しましたがすべてエラーでした。
> /usr/local/etc/xpdfrcには記載しているつもりなのですが。

この xpdfrc が読まれていないか、設定に問題があるということでしょう。

...で、すみません。タイプミスしていました。 

> # pdftotext -enc ECU-JP Book2.pdf out.txt
> Error: Couldn't find unicodeMap file for the 'ECU-JP' encoding
> Error: Couldn't get text encoding

EUC-JP が正解ですので、ECU-JP ならエラーが出て当然です。済みません。
再度 EUC-JP で試してください。

> # pdftotext -enc ja_JP.eucjp Book2.pdf out.txt
> Error: Couldn't find unicodeMap file for the 'ja_JP.eucjp' encoding
> Error: Couldn't get text encoding
> # pdftotext -enc eucjp Book2.pdf out.txt
> Error: Couldn't find unicodeMap file for the 'eucjp' encoding
> Error: Couldn't get text encoding

Namazu-users-ja#1156 では見過ごしましたが、ja_JP.eucjp や
eucjp を xpdfrc に追加されていますが、どういう理由で追加されている
のでしょう。
これらは削除してください。

> 今回の検証に使用したPDFファイルを寺西様個人のアドレスに添付させていただきます。

わかりました。そちらは確認しておきます。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns @ asahi-net.or.jp
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E



Namazu-users-ja メーリングリストの案内