[Namazu-win32-users-ja 471] Re: ReRe: 検索単語が2行にわたるPDFファイルの検索について

Tadamasa Teranishi yw3t-trns @ asahi-net.or.jp
2005年 10月 23日 (日) 16:02:48 JST


寺西です。

# 一行の桁数を 60-70 程度にしてください 

http://www.namazu.org/ml.html#misc

shinoda.m6yc @ excite.co.jp wrote:
> 
>  これは、kakasi-2.3.4、xpdf-3.01-win32及びxpdf-japanese-2004-jul-27
> とNamazu 2.0.15の組み合わせで、2行にまたがる「カタカナ」や
>「ひらがな」も検索対象のインデックス化が可能ということなのでしょうか。

2行にまたがる全角文字を連結してわかち書きを行うので、
そのように動作するはずです。

>  話は戻りますが、そうであれば、現在の環境下(kakasi使用)で、2行に
> またがる「カタカナ」を検索させたいファイル(たとえば、abc.pdf)と
> インデックスキーワード(「システム」や「ライセンス」)を、手で
> インデックス情報として、ファイルに登録することは可能なのでしょうか。

それは無理でしょう。インデックスは単純なテキストデータではありません
から、該当する部分を手でインデックスを書き換えることはほぼ不可能です。

Namazu 2.0.15 pre2 のソースを公開していますから、これをコンパイル
して使うという手はありますが...。
# ただ、Windows 環境でコンパイルするのは大変ですけど。

http://www.namazu.org/test/namazu-2.0.15pre2.tar.gz

あるいは、per2 のソースの中の該当部分の修正箇所だけ切り出して、
2.0.14 に反映するか、です。

いずれにしても、それなりの力量が必要かと思います。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns @ asahi-net.or.jp
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E




Namazu-win32-users-ja メーリングリストの案内