Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: pdfファイルの検索について



confirm 20030513141950869771743321 Hiroki Hiraya

平屋です。

On Wed, 27 Aug 2003 13:07:49 +0900
Tadamasa Teranishi <yw3t-trns@xxxxxxxxxxxxxxx> wrote:

> 寺西です。
> > 7.ではファイル名が表示されない件についてご教授願います。
> 
> こちらは、昨日の質問と同じ件だと思われますので、過去ログをまずは
> お調べください。

メールを出した後気づきました申し訳ありません。
  
> > 検索画面でpdfファイルの名前で直接検索したところ、
> > 
> > 6. 5-7.pdf (スコア: 17)
> >     著者: 不明
> >     日付: Fri, 04 Jul 2003 14:27:15
> >     TEL TEL TEL TEL TEL TEL TEL TEL TEL TEL TEL 
> >     http://*/0302/pdf/5-7.pdf (1,166,709 bytes)
> ...
> > 6.のファイルを
> > pdftotext -q -euc EUC-JP でtxtに変換すると
> > 日本語で読むことはできました。
> 
> 変換したテキストファイルは何でどのようにして確認しましたか?
> 変換したテキストファイルを vi で開くとどうなりますか?
viを使用して普通に開き、読むことはできました。

> 制御コードとTEL が大量に入っているということはありませんか?
見た感じでは制御コードとTELは大量に入っておりませんでした。
> 
> 基本的には pdftotext の変換結果のファイル先頭部分が summary に使われ
> ます。(PDF のレイアウトで最初の部分とは限りません。)
> pdftotext の結果と大きく異なるようでしたら、再現できる pdf ファイルを
> ご用意していただければ、調査することは可能です。
pdfファイルをお客様のデータですので送ることができません。
pdfinfoの結果をお送りいたします。
pdfファイルの内容は5コラムで3ページほどになっております。

Producer:     Acrobat Distiller 4.05 for Macintosh
CreationDate: Fri Jun 27 15:02:00 2003
ModDate:      Fri Jul 04 14:00:35 2003
Tagged:       no
Pages:        3
Encrypted:    no
Page size:    847 x 1224 pts
File size:    1086835 bytes
Optimized:    yes
PDF version:  1.4

他に必要な情報がありましたら、公開できる範囲で
公開することは可能ですので、ご対応のほど宜しくお願いいたします。

以上、宜しくお願いいたします。

> -- 
_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/
パナソニック ソリューションテクノロジー株式会社
            東日本SIグループソリューション第1チーム
                             平屋 宏記(Hiroki Hiraya)
                             hiraya@xxxxxxxxxxxxxxx
_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/