namazu-ml(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

英数字を含む日本語 PDFファイルの検索



はじめまして、大釜と申します。

Namazu v1.9.13 + pdftotextでPDFファイルの検索をしようとしています。
環境はTurboLunix Server1.2Jです。

日本語はうまく検索できるのですが、半角英数字が全角英数字として
インデックスされてしまっているようで検索できません。
(全角英数字でもプレーンなテキストファイルからなら
 半角英数字で登録されました)

(例)PDFファイル内に"NAMAZU"という文字がある
    → pdftotextで"NAMAZU"になる
    → そのままインデックス???

   namazu "NAMAZU"
   namazu "NAMAZU"
     どちらもヒットしない。("NAMAZU"として検索されている)

何か対処方法はありませんでしょうか?


◆◇◆  大釜みち代@モザイク  <ohgama@xxxxxxxxxxxxxx>  ◆◇◆