Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: pdftotext で変換できません。



大野@104.com です。早速のレスをありがとうございます。

やはりpdftotext の問題でしょうか?
先のメールで報告が足りませんでしたが、下記のようなエラーは
確認していました。

# pdftotext -eucjp /home/mo/public_html/pdf/lll.pdf outfile
pdftotext version 0.80 (decryption)
Copyright 1996-1998 Derek B. Noonburg
Decryption (originally) by Leo J.B. Smiers
Usage: pdftotext [options] <PDF-file> [<text-file>]
  -f <int>        : first page to convert
  -l <int>        : last page to convert
  -ascii7         : convert to 7-bit ASCII (default is 8-bit ISO Latin-1)
  -h              : print usage information
  -help           : print usage information


# pdftotext -eucjp /home/mo/public_html/pdf/lll.pdf -
Error: Couldn't open file '-eucjp'


# pdftotext /home/mo/public_html/pdf/lll.pdf -
Segmentation fault

となってしまいます。
再度確認中に気が付きましたが、ローカルマシン上だと
pdftotext、 xpdf ともにversionが0.80(上記エラー参照)
になっていますが、リモートからtelnetでlogin後に確認したら、
両方とも0.90でした。こんなことがあるのでしょうか?
つい先日ダウンロードしたばかりの xpdf-0.90.tgz で
0.80 をインストールした覚えは???ないはずなんですが。
少しパニックっていますが、pdfファイルindexにして検索
かけられるようにするには、諸先輩方が残してくれたlogの
とうりの環境(VersionDown)にて対応するしかないのでしょうか?
もう少し研究してみるつもりです。
ほかにも参考になるご意見がありましたらよろしくお願いします。
こちらから、参考になるデータを出せなくてもうしわけありません。
---
Makoto Ohno
mo@xxxxxxx


>
> たとえばご自身の環境で
>   $ pdftotxt  /home/mt/public_html/pdf/001.pdf outfile
> として、テキストデータが書出されますでしょうか?
>
> ためしに手元の計算機で、プロテクトされたPDFファイルに対しxpdf-0.90-fefe-diff2
> パッチをあてたpdftotextを用いてテストしてみましたが
>
> % pdftotext -eucjp ./test.pdf outfile
> Error: Copying of text from this document is not allowed.
>
> となり、書出し出来ませんでした。
>
>
> ----
> HIROSE Yoshihide
> yoshihide@xxxxxxxxxx