[Namazu-users-ja 996] Re: namazuで透明テキスト付きPDF検索が出来ない

HIROSE Yoshihide yoshihide @ fast.co.jp
2007年 11月 5日 (月) 17:54:49 JST


廣瀬と申します
pdftotext unkown font tag 
でgoogle検索すると
http://www.namazu.org/ml/namazu-win32-users-ja/msg01415.html
に,似たような状況が乗っていますが、いかがでしょうか。
要するに,日本語が正しく設定されているか、ということです。
正しくインデックスできていたと思われる日本語のPDF書類を

  pdftotext -enc EUC-JP sample.pdf sample.txt

してみて、再確認してください。
エラーがでるようなら,エラーの一部ではなく,全部を送ってください。

----
HIROSE, Yoshihide  hirose @ jippg.org
JIPPG'S BLACKLIST Project http://blacklist.jippg.org/


At Mon, 05 Nov 2007 17:12:31 +0900,
masaaki watanabe wrote:
> 
> 返信有難うございます。
> 今やってみたのですが・・・
> 
> ---一部抜粋---
> Error: Unknown font tag 'F0'
> Error (55822): No font in show
> Error (55822): No font in show
> Error (55822): No font in show
> Error (55825): No font in show
> Error (55827): No font in show
> Error (55831): No font in show
> Error (55834): No font in show
> Error (55838): No font in show
> ---一部抜粋---
> 
> とエラーが出まくりです。
> -enc Shift-JISでも同じ。
> 色々なHPを探すとOCRソフトで透明テキスト付きPDFにするとnamazuで検
> 索出来るような感じらしいのですが・・・・
> 透明テキストにするソフトが良くないのでしょうか?
> スキャンしたPDFをnamazuで検索するには何か方法はありませんでしょうか?
> お願い致します。
> 



Namazu-users-ja メーリングリストの案内