[Namazu-win32-users-ja 168] Re: インデックスが作成しきれない

naya SNA02388 @ nifty.com
2005年 1月 4日 (火) 12:19:33 JST


寺西さん,komaiさん,レスありがとうございます.

> mknmz が異常終了する原因を解決しないことには、何度やっても
> 同じことを繰り返すことになるのは当然のことのように思えます。

ごもっともです.
あたっているファイルを確認しても実に普通に使えてしまうので
それも困るのですが,怪しい部分をフォルダごと  --exclude したり
もしたのですが,次から次へとあたってしまうのですね...

だましだまし,一回インデックシングが完了してしまえば
こっちのものだと思ってましたが,甘かったです.

> > mknmz.bat 側からは,Word や PowerPoint,PDF に破損ファイルが
> > あるかのようなエラーをよく発せられますが,Windows 上で該当ファイルは
> > 普通に開閉,編集できます.
> > (つまり,なぜ mknmz.bat がエラーを吐くのか原因が突き止められない)
> 
> それならば、正確にエラーメッセージを提示するなりしてください。

その度にメッセージをスキップしてしまうため今すぐには提示できないのですが,
よくある「不正な処理のため終了します,ご不便おかけしてすみません」が
ほとんどのようです.ちなみに,これも必ず出るとは限りません.


> なお、PDF に関しては xpdf で開かないことには確認の意味がありません。

こちらは了解いたしました.

> なお、Perl の異常終了ということですから、Perl のバグとかメモリ不足
> だとかが原因ということもありえます。

いわれてみると,確かにメモリはクサいです.
ちょっと割当量が多すぎたかな....

> # 40MB って異常に大きいとは思うけど。

大きいファイルは,図表をたくさんはってあるものがほとんどです.
Namazuで検索したい「文字列」とはあまり縁のないファイルなので
いっそ外した方が賢明な気がしてきました.

> 段階的に試してみるにしても、メディアタイプ(拡張子)ごとにインデックス
> を作る方が効率的かもしれません。

これはすばらしいアイデアをご教示いただきありがとうございます.
komaiさんの:

> 「xdoc2txtを利用した文書フィルターのサンプル」に書かれている
> フィルターを用いて同様にIndex作成対象に対してトライしてみては如何でしょうか?

とあわせ,是非試してみたいと思います.

まずは御礼申し上げます.

--
naya,
SNA02388 @ nifty.com




Namazu-win32-users-ja メーリングリストの案内