[Namazu-users-ja 994] Re: namazuで透明テキスト付きPDF検索が出来ない

HIROSE Yoshihide yoshihide @ fast.co.jp
2007年 11月 5日 (月) 16:56:03 JST


廣瀬と申します

At Mon, 05 Nov 2007 15:46:42 +0900,
masaaki watanabe wrote:
> 
> 通常のPDF(Word等から生成したPDF)は検索出来るのですが、スキャナ等で読み
> 込み、e.TypistまたはScanPaperで透明テキスト付きPDFにすると検索してもHit
> しません。

namazuはpdfを検索するために xpdfに付属する pdftotextを利用しています。
pdftotext -enc EUC-JP sample.pdf sample.txt
などとして、うまく読み込めないファイルが正しくtxtデータに変換できているか確認してみてください。
うまく変換できていない場合は,残念ながらnamazuではインデクスすることはできません。

----
HIROSE, Yoshihide  hirose @ jippg.org
JIPPG'S BLACKLIST Project http://blacklist.jippg.org/






Namazu-users-ja メーリングリストの案内