Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: pdfファイルの検索について



confirm 20030513141950869771743321 Hiroki Hiraya

平屋です。

On Wed, 27 Aug 2003 14:12:01 +0900
Tadamasa Teranishi <yw3t-trns@xxxxxxxxxxxxxxx> wrote:

> 寺西です。
> 
> $ pdftotext -q -enc EUC-JP -raw 5-7.pdf test.txt
> 
> この結果でも問題がなければ、謎ですね。
この結果でも問題はありませんでした。
> 
> Windows 版の Acrobat で読み込んで、上書き保存したらどうなるで
> しょうか?
Readerしかなかったため、試すことができませんでした。

> $ mknmz --debug 5-7.pdf 
> 
> を実行するといろいろとデバッグ情報が出ます。
> // Field: summary: の結果はどうなっていますか?
// Field: summary: TEL TEL TEL TEL TEL TEL TEL TEL TEL TEL TEL TEL TEL TEL
// Field: from: 不明
// Field: date: Wed, 27 Aug 2003 14:29:19
// Field: title: 5-7.pdf
// Field: size: 1086835
// Field: uri: /72/logana/namazu/5-7.pdf
> // -- content -- の行以下は pdftotext の結果と同じものがでている
> でしょうか?
// -- content --
// TEL
// TEL
// TEL
の後にpdftotextの結果が出力されておりました。
> // -- wakatized bare content -- や
// tel
// tel
// tel
の後にpdftotextの結果が出力されておりました。
> // -- わかち書きされた内容 -- のところはどうなっていますか?
// tel
// tel
// tel
の後にpdftotextの結果が出力されておりました。

以上、宜しくお願いいたします。

_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/
パナソニック ソリューションテクノロジー株式会社
            東日本SIグループソリューション第1チーム
                             平屋 宏記(Hiroki Hiraya)
                             hiraya@xxxxxxxxxxxxxxx
_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/