[Namazu-users-ja 18] pnamazuを使用したgrep検索をpdfやoffice文書に対して行いたい

Dai NAKAMURA dnimail @ software.sanix.jp
2004年 7月 14日 (水) 10:29:45 JST


いつも参考にさせてもらっております。
中村と申します。

pnamazuの件で、上手い方法が考えつかずどなたかご教授いただければと
思っております。

検索語の存在する行を検索結果のサマリー表示したく思っております。
本家namazuでは、検索結果のサマリーは文頭の決まった文字数しか表示
しないようですので、インデックス作成は本家NAMAZUで、検索は
pnamazuのgrep機能を使用するようにしたく思っております。

その際、対象とする文書は、PDF及びMS-OFFICE文書を対象です。
利用範囲はイントラネットでしか行ないません。

mknmzでインデックスを作成後、pnamazuを導入し検索が可能な状態
になってます。
pconfig.pl中の、$MakeGrepを
$MakeGrep = 'default';
のように設定してgrep機能の設定をしております。

問題は、mknmzでインデックスを作成した原文書が、PDFやOffice文書
で文書フィルタを介してインデックス作成したため、pnamazuから原文書
を読み出すことができずGrep機能させることができない状態です。

検索結果は、.namazurcのreplaceで
file:////foo.pdf
のようにURI標記して原文書はMicrosoftNetworkで引用可能なようにして
おりますが、PDFやOfficeの文書フィルタを介したテキスト全文を
NAMAZUサーバーにプールしてpnamazuのGrep機能を使用するような事
が可能でしょうか?

どうぞよろしくお願いします。






Namazu-users-ja メーリングリストの案内