[Namazu-win32-users-ja 1155] 【Namazu2.0.17】MSExcel2007のインデックス化

t_saitou @ sk.kameda.co.jp t_saitou @ sk.kameda.co.jp
2008年 6月 19日 (木) 16:17:51 JST


※ 入会登録で失敗していたようで、再送させていただきます ※

掲題の件で、対応策を検討しております。

斎藤と申します。よろしくお願いします。

現在、Namazu2.0.17を(つい先日から)使い始め、MSOffice製品のインデックス化については、
xdoc2txt.exeを使用させていただいております。
インストールマシンはサーバとして使用しており、Excelなどは入っていません

しかし、Excel2007、Word2007の文書がインデックス作成時に弾かれてしまいます。

そこで、これらを検索対象とする策を検討しております。

■ いくつかのやり方があるかともいますが、アドバイス願えればありがたいです。
(私自身、cgiやPerlはまったくのシロウトで、当て外れな例かもしれませんが.....)

(1) 2.0.17 → 2.0.18 にバージョンアップする。
   その上で、xdoc2txt.pl、xdoc2txt.exeを使用する。
   (※ MSOffice2007の文書コンバータを使うことは考えていません)
   (コンパイラを変えたとか...動作は安定しているのもでしょうか? ...すみません)

(2) 2.0.17のままで、xdoc2txt.plだけを2.0.18のものを使う
   (そのまま使えるものでしょうか???)

(3) 2.0.17のxdoc2txt.plを修正する。
   よくわからず書きますが、xdoc2txt.pl内の以下の箇所に
sub add_magic ($) {
    my ($magic) = @_;

    # FIXME: very ad hoc.
    $magic->addFileExts('\\.ppt$', 'application/powerpoint');
    $magic->addFileExts('\\.xls$', 'application/excel');
    $magic->addFileExts('\\.jbw$', 'application/ichitaro6');
    $magic->addFileExts('\\.jfw$', 'application/ichitaro7');
    $magic->addFileExts('\\.jt[dt]$', 'application/x-js-taro');

    return;
}
   以下の行を追加する。↓
    $magic->addFileExts('\\.xlsx$', 'application/vnd.openxmlformats-officedocument.spreadsheetml');
    $magic->addFileExts('\\.docx$', 'application/vnd.openxmlformats-officedocument.wordprocessingml');

(4) xdoc2txt.pl、xdoc2txt.exeにこだわらず、他の手がある?
   (私には、他の手を考える引き出しがありません)

■ Namazuの動作環境ですが、以下のようになっています。
OS : Windows2000Server SP3
Perl: v5.8.8 Build 822
ppm: 4.01
IIS : 5.0

■ 蛇足ながら
   2.0.17以前は、2.0.16を使っていました。
   そこでExcel2007を何とかしたいと、いじっていたところ、インデックス作成時にエラーするようになりました。
   インデックス作成時どころか、mknmz -C ですらエラーするようになってしまいました。
Use of uninitialized value in concatenation (.) or string at c:\namazu\bin\mknmz line 416.
Can't locate .pl in @INC (@INC contains: C:/namazu/share/namazu/filter/win32 C:/namazu/share/namazu/filter C:\namazu\share\namazu/pl . C:/Perl/site/lib C:/Perl/lib) at c:\namazu\bin\mknmz line 416.

   そこで、2.0.17にすることにしました。しかし、単にVerUpしただけではExcel2007はNamazuの検索対象にできませんでした。

■ お忙しい中申し訳ありませんが、あったかい回答をよろしくお願いいたします。


Namazu-win32-users-ja メーリングリストの案内