[Namazu-users-ja 1254] Re: PDF検索がコマンドでは結果が出るがCGIでは結果がでません

earlybirdsinging earlybirdsinging @ gmail.com
2013年 5月 26日 (日) 01:09:01 JST


小笠原です。

> pltests というのが、Namazu のソースに含まれているのですが、
> Namazu をインストールしたら、それを実行してテストにパスするか
> 確認してください。

こちら、参考にさせて頂いていたサイトで「Namazu展開先ディレクトリを削除」
とやってしまっていたので、ありませんでした。。。

> それを確認しないで、PDF だけで試しているということは
> ないですよね?
> namazu.cgi が参照するインデックスは、namazu コマンドで参照
> しているインデックスをきちんと指定していますか?
> インデックスの指定方法分かっていますか?

PDFの検索が主だったので、他文書の検索をしておりませんでした。。。

/var/www/cgi-bin に namazu.cgi を配置しているので同階層に .namazurc
を配置して、Indexにはnamazurcと同様に
Index         /usr/local/var/namazu/index/open
としております。

問題切り分けの為に、
・Acrobatで作成したPDF
・text文書(mknmzrc内$DENY_FILEからtxtを消し$ALLOW_FILEに追記)
・html
・excelに検索語句を入れたものをからPDFで保存したもの
としてインデックスを作成しました。

# mknmz /var/www/html/aaa -O /usr/local/var/namazu/index/open

htmlとtxtはインデックス作成されて、WEBで検索結果に出て閲覧可能だったの
ですが、PDF文書はインデックス作成時に
Unable to convert pdf file (maybe copying protection)
と出てしまいます。

尚、コマンドで
# pdftotext -enc EUC-JP test.pdf out.txt
として、out.txtを見ると日本語として表示されます。

多々突っ込みどころがあって申し訳ありませんが、他に見直す点をご教授
頂けますでしょうか。

よろしくお願い致します。


Namazu-users-ja メーリングリストの案内