[Namazu-win32-users-ja 1052] Re: Office2007の文書をインデックス化すると「未対応の形式」となる

Tadamasa Teranishi yw3t-trns @ asahi-net.or.jp
2007年 11月 14日 (水) 22:28:45 JST


寺西です。

ryusei kannami wrote:
> 
> Windows2003Serverでxdoc2txtを使ったnamazuの全文検索サイトを構築しまし
> た。
> html、pdf、doc、xlsなどのインデックス化は正常に終了し検索結果
> も見ることができるのですが、インデックス対象のディレクトリにOffice2007
>> docxやxlsxをおいてmknmzを実行すると、
...
> 1/1 - /D|/www/sysimg/archive/%C7%E4%BE%E5%C9%BD.xlsx 未対応の形式
> (application/o
> ctet-stream)無視します
>> という結果となります。

filter/win32/xdoc2txt.pl は Office 2007 形式に対応していません。
最新の xdoc2txt は Office 2007 形式に対応しているようですが、以前
は対応していなかったため、まだこのフィルタは Office 2007 に対応で
きていません。

# ちょっと手直しすれば対応することは可能ですが...。

filter/msofficexml.pl の方を使ってくださ。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns @ asahi-net.or.jp
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E




Namazu-win32-users-ja メーリングリストの案内