namazu-dev(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: pdftotext(kakasi?)



yoshihide hirose <yoshihide@xxxxxxxxxx> wrote:

>[namazu 1371]からのスレッドに興味をもったので、pdfをいくつか
>作成し、最新のNamazuでインデクスしてみました。で、検索した結果が
>以下のようになっています。
(snip)
>元の文書に`-'`.'などが含まれていた場合、ただしく検索できていません。
>これは、kakasiの仕様ということでしょうか?

元の文書を変換したテキストファイルを見ないとわかりません。

  % pdftotext /usr/local/apache/htdocs/pdf/namazu-dev910.pdf foo.txt

で生成される foo.txt を見せてもらえます?

-- Satoru Takabayashi