Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

MS-Wordファイル名でHitせず



再びSetoです。
件名の事で悩んでおります。(悩んでばかりですが)

検索用ディレクトリに MS-WordとMS-Excelのファイルを設置。
インデックスディレクトリにて mknmz /xxxx/xxxx/*  <−− target path
して namazu.cgiにて検索を試みるのですが

Wordファイルについて検索キーとして
文書内の文字列を与えるとHitしてくれますが
ファイル名を与えてもHitしてくれません。
XXXX.doc に対して 'XXXX' でも 'doc' でもHitしません。
ファイル名がEUC日本語でも英数のみでも現象同じです。

同じ事をMS-Excelファイルで行うと 文書内(表内?)の文字列でも
ファイル名でもHitしてくれます。
YYYY.xls に対して 'YYYY' でも 'xls' でもHitします。

各フィルターの導入は以下のように行いました。
Wordについて
	http://prdownloads.sourceforge.net/wvware/のミラーから
	wv-0.7.2.tar.gzを ダウンロード
	tar xzf wv-0.7.2.tar.gz 
	cd wv-0.7.2 
	./configure 
	make 
	make install 

Excelについて
	xlhtml-0.4.tar.gz をダウンロードする。
	tar xzf xlhtml-0.4.tar.gz
	cd xlhtml-0.4
	./configure
	make
	make install

当然かもしれませんが mknmz後の NMZ.w には 'YYYY','.xls'は存在しますが
'XXXX' も '.doc' も存在しません。
どのあたりを確認すべきかアドバイスお願いいたします。

既にNMZ.wに無いのだから関係ないと思いますが
CGI用ディレクトリにある
.namazurcの設定は
Lang          ja_JP.eucJP


最後になってしまいましたが使用環境は
Redhat7.3 + Apache1.3.23
namazu-2.0.12
kakasi-2.3.4
nkf-1.92-6
lv-4.49.4-3


seto@xxxxxx .jp