Namazu-win32-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: pdf の全文検索の設定方法



足立@静岡です。


Mitsuo Satou さんは書きました:
>ども、佐藤@自宅です。
すいません、お世話になります。

>On Fri, 22 Dec 2000 10:23:14 +0900
>Hiroshi ADACHI <adachi@xxxxxxxxxxxxxxxxxxxxxx> wrote:
>
>> これらのことから、日本語の処理がうまくいっていないのではないか、と思ったの
>> です。
>
>以下のページを参考にしてPDFを試した所、インデックスが作成できました。
> http://www5.big.or.jp/~susumu/ih_pdfsearch/
>
>【作業内容】
>1.pdftotext.exe の準備
(以下略)

情報のご提供ありがとうございました。
早速やってみました。
しかし残念ながら、従来と同様、インデックスは出来ますがやはり日本語の検索は出
来ないようです。(英数字は出来ます)

佐藤さんの環境では、日本語の検索が出来ているんですよね。
どこが違うのだろう。


xpdfのソースをダウンロードしてINSTALLファイルをよんでみたのですが、これによる
と、日本語のとおるpdftotext.exeは、以下のオプションを付けてconfigureスクリプ
トをはしらせろと書いてあるようです。ただし、これはUNIXシステムについての説明
で、Winについては同様の記述はありません。
私、UNIXは殆ど知らないのですが、configureとはコンパイルしてexeを作り直すこと
でしょうか。
佐藤さんが日本語検索が出来ているとすると、Winはこの機能を含ませて実行ファイル
が作られているのでしょうか。

INSTALLファイルによると、
>* Run the configure script:
>    ./configure
(略)
>    --enable-japanese
>        Enables support for 16-bit Japanese fonts.  This increases the
>        size of the binary (mostly with decoding tables).  The default
>        is no Japanese font support.
(略)


私の環境は以下の通りです。NTとAcrobat(readerではない)だけ異なります。
【動作確認環境】
 ・WindowsNTsp6
 ・namazu 2.0.5
 ・kakasi 2.3.2
 ・ActivePerl 5.6.0.620
 ・AN HTTPD 1.32f
 ・pdftotext 0.92(xpdf-0.92-win32-ms.zip)
 ・gzip 1.2.4
 ・Acrobat 4.05J