Namazu-win32-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: ole $B%*%W%7%g%s(B



白井です。

# ちょっと気になる。:-)

From: U86128@xxxxxxxxxxxxxxxxx <U86128@xxxxxxxxxxxxxxxxx> さん曰く
Subject: [namazu-win32-users-ja] Re: ole オプション
Message-ID: <200003061852091091.223@xxxxxxxxxxxxxxxxx>
Date: Mon, 6 Mar 2000 18:52:08 +0900

上口>  $ALLOW_FILE =	".*\\.(?:$HTML_SUFFIX)|.*\\.txt" .
上口>  		"|.*\\.pdf|.*\\.doc|.*\\.xls" .
上口> 		"|.*\\.ppt" .

これって、/namazu/etc/mknmzrc (~/.mknmzrc あるいは -I file) を上
記のように書き換えたということでしょうか?

 $ALLOW_FILE =	".*\\.(?:$HTML_SUFFIX)|.*\\.txt" .
 		"|.*\\.pdf|.*\\.doc|.*\\.xls" .
		"|.*\\.ppt";

だとどうですか。

# もし、上口さんのかかれたままだと Perl の代入文になっていないの
# で。。。試したのですが、エラーにはならないで、default 設定を使
# うようです。

もし、私の推測が正しければ、

From: kenzo-@xxxxxxxxxx (Ken-ichi Hirose) さん曰く
Subject: [namazu-win32-users-ja] Re: ole オプション
Message-ID: <199712311634.BAA03595@xxxxxxxxxxxxxxxxxxxxx>
Date: Thu, 1 Jan 1998 01:34:45 +0900 (JST)

広瀬>  <U86128@xxxxxxxxxxxxxxxxx> wrote.
広瀬> /~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
広瀬> >と改め、検索対象ファイルには word,xls,powerpoint,pdf と4ファイルを用意して
広瀬> >mknmz -a -O e:\www\index . を実行しましたが
広瀬> >4個のファイルがインデックス作成の対象として見つかりました
広瀬> >1/4 - /E|/www/Trip/test_ppt.ppt 未対応の形式 (application/msword)無視します
広瀬> >1/3 - /E|/www/Trip/test_word.doc 未対応の形式 (application/msword)無視します
広瀬> >1/2 - /E|/www/Trip/test_xls.xls 未対応の形式 (application/powerpoint)無視します
広瀬> >1/1 - /E|/www/Trip/text_pdf.pdf 未対応の形式 (application/pdf)無視します

こちらは、--ole(-o) option が無いから、pdf 以外の挙動は納得でき
ます。pdf が無視されるのは

上口> さっそく xpdf-0.90-win32 より pdftotext を追加し

pdftotext.exe に path が通っていないということは無いでしょうか?

広瀬> >同環境を用いて、
広瀬> >mknmz -o -O e:\kamiguch\www\index . を実行しますと
広瀬> >2個のファイルがインデックス作成の対象として見つかりました
広瀬> >Use of uninitialized value at C:/namazu/share/namazu/filter/gfilter.pl line 67.
広瀬> >Use of uninitialized value at C:/namazu/share/namazu/filter/gfilter.pl line 70.
広瀬> >1/2 - /E|/www/Trip/test_word.doc [application/msword]
広瀬> >2/2 - /E|/www/Trip/text_pdf.pdf 未対応の形式 (application/pdf)無視します
広瀬> 
広瀬> -a と -o の組合せで動作が変わるという事ですね?

こちらは、きっと '--all --ole' と二つ書けば大丈夫なのではないで
しょうか。

# ただし、私の環境では excel と powertpoint は Win32::OLE がエラー
# しまくるので動作しませんけど。。。

# File-MMagic が MS-Office の file type を誤判別するしね。
# MS の作る file の Magic Number って 100% 判定するのは無理なん
# じゃないかなぁ、と思っています。Win32::OLE のときは、気持悪い
# けど '拡張子' で判別なのかなぁ。

-- 
白井秀行 (mailto:shirai@xxxxxxxxxxxxxxxxxxx)