[Namazu-win32-users-ja 463] Re: Office文書の検索

Tadamasa Teranishi yw3t-trns @ asahi-net.or.jp
2005年 10月 19日 (水) 01:00:44 JST


寺西です。

Mayumi Ikeda wrote:
> 
>   > mknmz に --debug を付けてデバッグ情報を表示させてください。
> 
> 最初に、おそらくスキャンしているファイルに対して、
> @@不許可  @@適合 というものがついた行がずっと表示されます。

という情報が見たいのですが...。

> (不許可というのは、実行ファイルとか圧縮ファイルなど、対象外の
> ファイルのようです)

では、
 > まず、検索対象フォルダは、100GBぐらいあって
 > ファイル数は、約12万ぐらいある状態です。
 > (ほとんどはテキストファイルか、Excel、Word、PPT
 > ファイルですが)
 > 
 > mknmz を実行すると、対象ファイルが 10979個となり、
 > 1桁小さいです。
と書かれていますが、どちらが正しい情報なのでしょう。

・ほとんどはテキストか、Excel, Word, Powerpoint で約12万なのか
・実行ファイル、圧縮ファイルなどが含まれて約12万なのか 

> そのあと添付のように半角カタカナのメッセージがずっと出てきます。
> DOS窓で表示させるからでしょうか?
> これもEUCコードでしょうか?

EUC-JP です。
もっともそこが見たい場所ではなく、問題のエラーメッセージの前後が
見たいところなんですが。

> debug出力をファイルに出力させる方法がありますでしょうか?

リダイレクション

http://www.microsoft.com/resources/documentation/WindowsServ/2003/standard/proddocs/ja-jp/Default.asp?url=/resources/documentation/WindowsServ/2003/standard/proddocs/ja-jp/redirection.asp 

>   > >  対象フォルダの階層とか、パスの長さに制限はあるでしょうか?
>   >
>   > 日本語のファイル名、ディレクトリ名には制限があります。
>   > # 漢字のファイル名はおまけ程度の対応に過ぎません。
> 
> どのような制限でしょうか?
> 長さでしょうか?
> 思いっきり、日本語のパス名ばかりなんです。

長さではなく、使用できる文字の種類等です。
# なんせおまけ程度なんで。

>   > その他はとりあえず OS の制限に従うのですが、Perl 側の制限がかかり
>   > ます。

ActivePerl は日本人が作ったわけじゃないのですから、日本語ファイル名
なんて考えて作られていません。しかも、日本語といっても Shift_JIS は
いろいろと厄介なコード体系であり、それを外人さんが理解してきちんと
動くように作るのはやっぱり難しいことです。

>   > > さらに、途中で止まってしまいます。
>   > >
>   > > 80/10979 - /F|/Kankyo/03_Step2/%B8%F8%B3%AB%BE%F0%CA%F3%C0%E2%CC%C0%A5%DE%A5%CB%
>   > > A5%E5%A5%A2%A5%EB%282005.03.24%29%20%281%29.xls [application/excel]
>   >
>   > このファイルは Excel で普通に開きますか?
> 
> はい、もちろん開きます。

んー。Excel が裏で走っているとか? タスクマネージャを開いて
「プロセス」に Excel が走っていたりしませんか?

このファイルの処理以前で Excel の処理が完了しているものとかあり
ますか?

このファイル単体を mknmz で実行した場合はどうなりますか?
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns @ asahi-net.or.jp
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E




Namazu-win32-users-ja メーリングリストの案内