[Namazu-users-ja 400] Re: 橡を表示させないためには

Tadamasa Teranishi yw3t-trns @ asahi-net.or.jp
2005年 5月 24日 (火) 20:37:02 JST


寺西です。

norizo a wrote:
> 
>「橡」が表示されてませんが、.xpdfrc の設定がまずいのでは?

/etc/xpdfrc (インストール先により異なりますが) の textEncoding を
EUC-JP にしておきましょう。

> pdfinfo -enc EUC-JP PDFファイル名 の結果になります。
> 
> Title:          橡アクセサリーアンジュ/有限会社自優路
> Subject:        橡
> Keywords:       橡販売スタッフ、卸、小売業
> Author:         橡
> Creator:        橡やさしくPDF OCR v.2.0 for Windows
> Producer:       橡やさしくPDF OCR v.2.0 for Windows
> CreationDate:   Thu May 19 18:38:07 2005
> Tagged:         no
> Pages:          1
> Encrypted:      no
> Page size:      600 x 845 pts
> File size:      185572 bytes
> Optimized:      no
> PDF version:    1.4

あらあら。いろんな項目に「橡」があるのですね。
しかし、
 
>  pdfinfo -enc EUC-JP PDFファイル名 | grep 'Title:' | od -tx1 -a
> 
> 0000000 54 69 74 6c 65 3a 20 20 20 20 20 20 20 20 20 20
>           T   i   t   l   e   :  sp  sp  sp  sp  sp  sp  sp  sp  sp  sp
> 0000020 c6 cb a5 a2 a5 af a5 bb a5 b5 a5 ea a1 bc a5 a2
>           F   K   %   "   %   /   %   ;   %   5   %   j   !   <   %   "
> 0000040 a5 f3 a5 b8 a5 e5 2f cd ad b8 c2 b2 f1 bc d2 bc
>           %   s   %   8   %   e   /   M   -   8   B   2   q   <   R   <
> 0000060 ab cd a5 cf a9 0a
>           +   M   %   O   )  nl
> 0000066
> 
> の用に表示されました。

を見る限り問題なさそう。pdf.pl を差し替えた上で、

$ mknmz 問題のPDFファイル
$ namazu "+subject:*" .

の結果はどうなりますか?
「橡」がどこに出るのか再確認してみましょう。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns @ asahi-net.or.jp
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E




Namazu-users-ja メーリングリストの案内