[Namazu-win32-users-ja 1191] excelファイルの解析中にmknmzが止まる件について

yoshihiko yokota yokota.yoshihiko @ rks.renesas.com
2009年 5月 13日 (水) 10:50:29 JST


Namazuメーリングリストメンバー様

横田と申します。
お世話になります。

「Namazu for Windows」を「Windows2003Server」上で
使用しておりますが、mknmzでインデックスの作成中に
処理が止まってしまいます。

具体的には、コマンドプロンプトから「mknmz -s -d -U -O」コマンドを
実行し、インデックス作成元フォルダのファイル解析を行っている最中に
「@@ 適合: ファイル名.xls」と言う表示のまま処理が止まります。

    [mknmz使用オプション詳細]
    -s, --checkpoint         チェックポイント機構を作動させる
    -d, --debug               デバッグモード
    -U, --no-encode-uri      URIのencodeを行わない
    -O, --output-dir=DIR     インデックスの出力先を指定する

インデックス作成元フォルダは複数あり、
どのフォルダにも「excel,word,powerpoint,pdf」等の文書ファイルが
1万〜5万件程格納されております。
ファイル数が多い為、インデックス作成先も複数に分けて
大フォルダでの区分毎にインデックスの作成を行っており、
他のフォルダではインデックスの作成に成功しておりますが、
特定のフォルダのインデックスを作成する際に、毎回上記表示で
インデックスの作成が止まってしまいます。
また、停止時の「ファイル名.xls」は毎回同一のファイルです。

下記に利用環境の詳細を記させて頂きます。

【利用環境詳細】
・Namazu - Namazu for Windows 2.0.18
・OS - Windows2003Server R2
・httpd - Apache2.0.63
・Office - 未インストール

【変更済みフィルタ】
・Excel - msword2.pl
・Word - msword2.pl
・Pdf - Xpdf 3.02

【カスタマイズ箇所詳細】
・Excel,Word解析用のフィルタについては、下記ページを参考にし、
フィルタを「excel.pl,msword.pl⇒msword2.pl」へと変更致しました。
    WindowsでNAMAZU-フィルタの交換方法
    http://www.alles.or.jp/~oga/namazu2/change_filter.htm

・Xpdfは、下記ページを参考にして設置しました。
    ITNavi.com-Namazuで検索する(Windows編)
    http://itnavi.com/NamazuForWin/#inst2

【mknmz-Cの実行結果】
C:\namazu\bin>mknmz -C
読み込んだ設定ファイル: C:/namazu/etc/namazu/mknmzrc
システム: MSWin32
Namazu: 2.0.18
Perl: 5.008008
File-MMagic: 1.27
NKF: module_nkf
KAKASI: module_kakasi -ieuc -oeuc -w
茶筌: module_chasen -i e -j -F "%m "
和布蕪: module_mecab -Owakati -b 8192
わかち書き: module_kakasi -ieuc -oeuc -w
メッセージの言語: ja_JP.SJIS
言語: ja_JP.SJIS
文字コード: sjis
CONFDIR: C:/namazu/etc/namazu
LIBDIR: C:/namazu/share/namazu/pl
FILTERDIR: C:/namazu/share/namazu/filter
TEMPLATEDIR: C:/namazu/share/namazu/template
対応メディアタイプ:   (24)
未対応メディアタイプ: (27) 必要ツールが $path にないものには (-) を表示
  application/excel: msword2.pl
  application/gnumeric: gnumeric.pl
- application/ichitaro4: ichitaro456.pl
  application/ichitaro5: taro56.pl
  application/ichitaro6: taro56.pl
  application/ichitaro7: taro7_10.pl
  application/macbinary: macbinary.pl
- application/ms-visio: olevisio.pl
  application/msword: msword2.pl
  application/pdf: pdf.pl
- application/postscript: postscript.pl
  application/powerpoint: xdoc2txt.pl
  application/rtf: msword2.pl
- application/visio: olevisio.pl
- application/vnd.kde.kivio: koffice.pl
- application/vnd.kde.kpresenter: koffice.pl
- application/vnd.kde.kspread: koffice.pl
- application/vnd.kde.kword: koffice.pl
- application/vnd.oasis.opendocument.graphics: ooo.pl
- application/vnd.oasis.opendocument.presentation: ooo.pl
- application/vnd.oasis.opendocument.spreadsheet: ooo.pl
- application/vnd.oasis.opendocument.text: ooo.pl
- application/vnd.openxmlformats-officedocument.presentationml: 
msofficexml.pl
- application/vnd.openxmlformats-officedocument.spreadsheetml: 
msofficexml.pl
- application/vnd.openxmlformats-officedocument.wordprocessingml: 
msofficexml.pl

- application/vnd.sun.xml.calc: ooo.pl
- application/vnd.sun.xml.draw: ooo.pl
- application/vnd.sun.xml.impress: ooo.pl
- application/vnd.sun.xml.writer: ooo.pl
- application/vnd.visio: visio.pl
  application/x-apache-cache: apachecache.pl
- application/x-bzip2: bzip2.pl
- application/x-compress: compress.pl
- application/x-deb: deb.pl
- application/x-dvi: dvi.pl
  application/x-gzip: gzip.pl
  application/x-js-taro: taro7_10.pl
- application/x-rpm: rpm.pl
- application/x-tex: tex.pl
  application/x-zip: zip.pl
  audio/mpeg: mp3.pl
  message/news: mailnews.pl
  message/rfc822: mailnews.pl
  text/hnf: hnf.pl
  text/html: html.pl
  text/html; x-type=mhonarc: mhonarc.pl
  text/html; x-type=pipermail: pipermail.pl
  text/plain
  text/plain; x-type=rfc: rfc.pl
  text/x-hdml: hdml.pl
- text/x-roff: man.pl

上記問題の為、Namazuの実用化に至らず困っております。
ご回答頂けると幸いです。よろしくお願い致します。 




Namazu-win32-users-ja メーリングリストの案内