Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: インデックス作成時のPDF文字化けについて



平沢です。
>1. PDF だけが文字化けする。また、文字化けは日本語部分である。
>2. PDF のファイル名は日本語ではない。
>3. pdftotext を使っている。

>もし当てはまっているのであれば、おそらくは pdftotext(xpdf 全体)が
>日本語対応していない古いバージョンなのか、日本語のモジュールが
>インストールされていない、または設定に不備があるのではないで
>しょうか?

>とりあえず、pdftotext のバージョンは何でしょう。
 
お答えありがとうございます。
1と2は当てはまっています。
3に関してはサーバーに問い合わせをしないとわかりませんが・・
これは問い合わせをして答えて頂ける性質のものなのでしょうか?
それから、書き忘れましがPDFの文字化けは一部分なのですが(全て文字化け
する訳ではないという現象です)正常にテキスト化されて検索可能なPDFファイル
もあります。その場合もpdftotextに関係していますか?
いずれこちらで原因をある程度分かった上でサーバーに問い合わせたいと考えています。