Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

pdftotext で変換できません。



はじめまして。大野@104.com です。

index作成時にpdfファイルでエラーが出て思うようにいきません。
参考になるデータ、書籍がみつからず投稿させていただきます。
当方の環境を簡単に書き出します。

LASER5 Linux 6.0 jp
uname -a    2.2.5-22lv3
nkf -v        1.62
xpdf           0.90
pdftotext    0.90
kakasi        2.3.2
MMagic      1.06

〜mknmz -Cの結果〜
システム: linux
Namazu: 2.0.4
Perl: 5.00503
NKF: /usr/bin/nkf
KAKASI: /usr/local/bin/kakasi -ieuc -oeuc -w
ChaSen: /usr/bin/chasen -j -F '%m '
わかち書き: /usr/local/bin/kakasi -ieuc -oeuc -w
言語: ja_JP.ujis
文字コード: euc
CONFDIR: /usr/local/etc/namazu
LIBDIR: /usr/local/share/namazu/pl
FILTERDIR: /usr/local/share/namazu/filter
TEMPLATEDIR: /usr/local/share/namazu/template
対応メディアタイプ:
  application/pdf
  application/x-bzip2
  application/x-compress
  application/x-gzip
  message/news
  message/rfc822
  text/hnf
  text/html
  text/html; x-type=mhonarc
  text/plain
  text/plain; x-type=rfc
  text/x-roff

メーリングリストの過去ログを参考に、pdf.pl フィルターや、.namazurcなどの
設定なども見直しては見たのですが解決できませんでした。
「なまず本」も手元にありますが、pdfの件があまりのってなく困っています。
下記にindex作成時のエラーを記載します。xpdf-0.90-fefe-diff2
http://www.foolabs.com/xpdf/decryption.html のパッチも当ててみましたが
結果は同じです。

〜  mknmz -a /home/mt/public_html/pdf/ の結果〜
1/22 - /home/mt/public_html/pdf/001.pdf Unable to convert pdf file (maybe
copying protection)
1/21 - /home/mt/public_html/pdf/001.txt はサイズが 0 なので無視します
1/20 - /home/mt/public_html/pdf/003.pdf Unable to convert pdf file (maybe
copying protection)
1/19 - /home/mt/public_html/pdf/005.pdf Unable to convert pdf file (maybe
copying protection)
[基本]
日付:                Thu Jun  1 21:06:45 2000
わかち書き:          /usr/local/bin/kakasi -ieuc -oeuc -w
経過時間 (秒):       4
ファイル/秒:         0.00
システム:            linux
Perl:                5.00503
Namazu:              2.0.4


参考になるデータや、書籍、ご意見などどんなことでも結構ですので
教えていただければ幸いです。よろしくお願いします。
ちなみに、MHonArc2.4.6は正常に動いています。