[Namazu-users-ja 403] Re: [Namazu-devel-ja 429] Re: Re: 橡を表示させないためには

Yukio USUDA m6694ha392t @ asahi-net.or.jp
2005年 5月 25日 (水) 22:56:55 JST


臼田です

Tadamasa Teranishi wrote:
> 
> 実は、tests/data/ja/acrobat[34].pdf でも pdfinfo を使って確認すると
> Creator: のところで起こります。
> やっぱり xpdf の処理の不具合といえばそうかもしれませんが、何だか
> PDF にとってもローカルな仕様があるのが諸悪の根源な気はしますが...。
> # はて、さて。
> 

確かに tests/data/ja/acrobat[34].pdf の中身にも
'001B6A61001B'がありますね。
でも手元の pdfinfo 3.00  (xpdf3.00に付属のもの)では
'001B6A61001B'はちゃんと除去されるようで
「橡」が表示される現象は再現しませんでした。

原因は xpdfrc の設定の違いでしょうか?

> 
> ついでに、PDF に含まれる Keywords も反映したいところです。
> # 単語の区切りはスペースかと思っていましたが「、」で区切られることも
> # あるのかなぁ。
> -- 
Keywordsも反映すると良いでしょうね。
登録の際に「、」を使ったのではないでしょうか
とりあえずそのまま本文の後ろにでもつけるか
区切り文字「、。,.」等の部分で分割してから
重み付けをして追加しておくとよいのではないでしょうか

臼田幸生




Namazu-users-ja メーリングリストの案内