Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

(Re: mknmzrcの記述でperlのエラー)「(application/pdf)未対応の形式」エラー




yoyoです。

> > そこにセミコロンを書くと、インデックス化対象ファイルが
> > HTMLとテキスト「だけ」になりますが、それでよろしいのですね?
> > mknmz実行時のオプション指定によっては、「だけ」じゃないかも
> しれません。


ご指摘ありがとうございます。
あとPDFファイルも対象としたいので

mknmzrcを

$ALLOW_FILE = ".*\\.(?:$HTML_SUFFIX)|.*\\.txt" . # HTML, plain text

# "|.*\\.gz|.*\\.Z|.*\\.bz2" . # Compressed files

"|.*\\.pdf" ; # PDF

# "|.*\\.tex" . # TeX

# "|.*\\.doc|.*\\.xls" . # Word, Excel

# "|.*\\.j[sab]w" . # Ichitaro 4, 5, 6

# "|\\d+|[-\\w]+\\.[1-9n]"; # Mail/News, man

にしました。
するとperlのエラーは出ないのですが、
インデキシングの際にpdfファイル全てに「(application/pdf)未対応の形式」と
出てしまいます。
ファイルサイズも100kbのものもあれば1Mもあるのですが全てインデキシングされま
せん。
mknmzrcの下のほうの記述($EXCLUDE_PATH 以下)は
$TEXT_SIZE_MAX = 1500000;
以外全てコメントアウトしています。

過去ログを見てみるとpdftotextというツールをいれるのかなとも思うのですが。








_________________________________________________________________
ネットを使うひとに有利な特典いっぱい MSN カード http://card.msn.co.jp/