[Namazu-users-ja 1274] Re: パスワード付き

Tadamasa Teranishi yw3t-trns @ asahi-net.or.jp
2013年 7月 21日 (日) 23:34:38 JST


寺西です。

(2013/07/21 22:36), &1 wrote:
>>  各情報は以下の通りです
>> *********mknmz -C****************************
>> 読み込んだ設定ファイル: /usr/local/etc/namazu/mknmzrc
>> システム: linux
>> Namazu: 2.0.21
>> Perl: 5.010001
>> File-MMagic: 1.27
>> NKF: /usr/bin/nkf
>> KAKASI: /usr/local/bin/kakasi -ieuc -oeuc -w

KAKASI も Perl モジュールの方が速いので、そちらを
お勧めします。

>> メッセージの言語: ja_JP.utf8
>> 言語: ja_JP.utf8

ja_JP.utf8 はサポートしていないので、環境変数を設定して
ja_JP.eucJP でご使用ください。(ja_JP.utf8 では正しく
動作しないです。)

あとは問題なさそうです。

>> pdftotext version 3.03
>> Copyright 1996-2011 Glyph & Cog, LLC
>> Usage: pdftotext [options] <PDF-file> [<text-file>]

Namazu 2.0.21 の filter/pdf.pl が想定している
Glyph & Cog, LLC 版の pdftotext を使われているようですので、
こちらは問題なさそうです。
# 正しくインストールされておればですが。

>>  -opw <string>     : owner password (for encrypted files)
>>  -upw <string>     : user password (for encrypted files)

オーナーパスワードとユーザパスワードがあります。
それぞれ -opw, -upw で指定します。

Namazu はとりあえず横においておいて、pdftotext コマンドを
にパスワードを指定して PDF ファイルからテキストが抽出
できるかどうかご確認ください。

例) オーナーパスワード指定の場合
$ pdftotext -q -raw -enc EUC-JP -opw password pdffile

これができないと、Namazu でも使えませんから。

>> pdfinfo version 3.03
>> Copyright 1996-2011 Glyph & Cog, LLC
>> Usage: pdfinfo [options] <PDF-file>

こちらも Glyph & Cog, LLC 版で

>>  -opw <string>     : owner password (for encrypted files)
>>  -upw <string>     : user password (for encrypted files)

オーナーパスワードとユーザパスワードがあります。
こちらも pdfinfo コマンドにパスワードを指定して PDF ファイル
の情報を出力できるかどうか確認してください。

例) オーナーパスワード指定の場合
$ pdfinfo -enc EUC-JP -opw password pdffile


pdftotext, pdfinfo の両方共、うまく動作したなら、
次は filter/pdf.pl にパスワードを指定するように修正します。

pdftotext の引数は @pdfconvopts 配列に、
pdfinfo の引数は @pdfinfoopts 配列に指定しますので、
ここにパスワードの指定を追加します。

例えばこんな感じです。

@pdfconvopts = ('-q', '-raw', '-enc', 'EUC-JP', '-opw', 'password');

@pdfinfoopts = ('-enc', 'EUC-JP', '-opw', 'password');
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns @ asahi-net.or.jp
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E


Namazu-users-ja メーリングリストの案内