[Namazu-win32-users-ja 127] SEARCH_FIELDの追加

Tetsuya Obayashi tetsu @ arcadia-ent.com
2004年 12月 8日 (水) 14:04:20 JST


初めて投稿させていただきます、大林と申します。

初めての投稿ですので、全く見当違いな内容かもしれませし、情報の過不足など
あるかも知れませんが、その際は、ご指導ご鞭撻のほどよろしくお願いします。

この度、社内向け全文検索エンジンの導入を検討した結果、要求仕様のほぼ全て
が網羅されている為、Namazuで構築しようと考えております。

現在試験環境を下記の通り構築いたしました。
- Win2000 SP4
- ActivePerl 5.8
- Namazu 2.0.13b
- Kakasi 2.3.4
- xpdf 3.0

試行錯誤しながら、何とかインデックスを作成し、全文検索が出来るところまで
はこぎつけたのですが、WordやExcelなどのMSオフィスドキュメント内のファイ
ル->プロパティで閲覧できる、タイトル、サブタイトル、作成者、などのField
を特定して検索するという点で、行き詰っております。

最初に行ったのは、mknmzrc内の、$SEARCH_FIELDを下記の通り変更した結果、中
身がIndexを作成したファイルの数だけ改行のみが入っている、fieldインデック
ス(NMZ.field.categoryなど)が作成されました。
$SEARCH_FIELD ="keywords|title|comments|category|subject|from|date|uri|to|summary|size";

そこで、まったく見当違いかもしれませんが、MS Wordドキュメントフィルタと
思われる、olemsword.pl内のgetPropertiesサブルーチンを下記の通り変更して
みたのですが、結果は全く変わりませんでした。

    my $keyword = $cfile->BuiltInDocumentProperties('Keywords')->{Value};
    $keyword = $cfile->BuiltInDocumentProperties('Keywords')->{Value}
	unless (defined $keyword);
    $fields->{'Keywords'} = codeconv::shiftjis_to_eucjp($keyword)
	if (defined $keyword);

    my $category = $cfile->BuiltInDocumentProperties('Category')->{Value};
    $title = $cfile->BuiltInDocumentProperties('Category')->{Value}
	unless (defined $category);
    $fields->{'Category'} = codeconv::shiftjis_to_eucjp($category)
	if (defined $category);

    my $comments = $cfile->BuiltInDocumentProperties('Comments')->{Value};
    $comments = $cfile->BuiltInDocumentProperties('Comments')->{Value}
	unless (defined $comments);
    $fields->{'Comments'} = codeconv::shiftjis_to_eucjp($category)
	if (defined $comments);

本来の、Namazuの仕様には無いかもしれませんが、タイトルや作者でのField検
索が出来るので、何か方法があるのではないかと思っております。

どんな事でも結構ですので、もしご存知の方がいらっしゃいましたら、是非ご教
授下さい。

よろしくお願いいたします。





Namazu-win32-users-ja メーリングリストの案内