Namazu-win32-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

pdftotext にて文字化けします。



はじめまして。
岩崎と申します。どうぞ、よろしくお願いします。

イントラにて「namazu検索機能」を導入したいと考えています。

そこで、質問です。
現在、Windows98にnamazuをインストールしています。
検索は、html,Word,exel,textファイルは成功しています。
しかし、PDFファイルの部分で失敗しています。
過去メールを参照させていただき、PDFのファイル名の検索は可能と
なりました。
ですが、検索結果画面でPDFファイルの検索結果が
文字化けしています。

============== 検索画面 ======================
検索結果
参考ヒット数: [ pdf: 118 ] 

検索式にマッチする 118 個の文書が見つかりました。

1. sysm_inst.pdf (スコア: 19) 
著者: 不明 
日付: Thu, 12 Apr 2001 17:02:24 
System Managerx|矛・ z鐵 PCwg||坊0ftzAs愧>)B`|慣 tK"g・ 苣暗`o g|矇b"\ q>q`h膏帳zpb{,^h概
========================================================================

現状の問題は、下記です。
・PDFファイル名を検索しており、PDFファイルの中身は検索されていない
・半角英数字は変換可能であるが、漢字が変換されていない。
・DOS上でpdftotextを使用し、PDFファイルをtextファイルに変換しようとしたが、
 変換されたtextファイルの中身は、文字化けであった。

問題はpdftotextにあると思うのですが、解決策が見つかりません。
みなさまにて、この問題を解決されたという方または解決策をご存知の方が
いらっしゃれば、ぜひご教示願います。
現在本当に困っており、皆様に不躾な質問だと承知の上、
メールさせていただきました。

現在の環境は、下記です。
namazu:Namazu for Win32 (ver 2.0.8)
CGI :perl5.6.1
XPDF:pdftotxt(xpdf-1.00-win32-ms.zip)
   C:\namazu\bin\下に「xpdf-japanese,tar,gz」も
   格納しています
     ※:xpdf-0.92-win32-ms.zipも使用してみましたが、
    結果は同じでした。
OS :Windows98
   ※:テスト環境として、クライアントPCをローカルサーバに
    しています。(httpdを使用)
  
どうぞ、よろしくお願いします。

岩崎

----
Jyunko Iwasaki  jyunko@xxxxxxxxxxxxxxxxxxx