Namazu-win32-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re:$FILE_SIZE_MAX について



原田@福岡です

>At 18:11 01/01/10 +0900, you wrote:
>こんにちは
>千葉と申します。
>
>mknmz でエクセルファイルのインデックスを作成したところ
>1Mbyteを超えるファイルが「ファイルが巨大で無視・・・」
>となってしまいます。

途中略
>$FILE_SIZE_MAX = 2000000; #コメントをはずした

excelファイルの中味にもよると思いますが、
昨年12月末での#ML00518及びその近辺のMLで佐藤@大和鑑定さんが
word,excel系での修正をまとめておられますので、
(パスワード付文書のインデックス及びexcelの範囲を絞る件等)
まず、過去のMLを参考にされた方が早道ではないでしょうか。
丁度私も、佐藤@大和鑑定さんのまとめをみて、環境(namazuの中)を変更しようと
している時でしたから、やってみました。

手元に新しいexcelの2Mくらいのファイルがなかったので
kakaku.csv(11MB)をexcelファイルに変更しました。
残念ながらWINNT4.0では試しておりませんが、
環境:Win32(98SE及び2000proで実施)
kakasi(2.3.2):perl(5.6build620):namazu(2.05)
Apache(1.3.12)
conf.pl(mknmzrcの方も一応合わせています)のファイルサイズ、
textサイズは自分用の環境向けに取り敢えず大きめに修正。

conf.plとoleexcel.plを変更しなかった場合:ファイルが巨大なので・・・と なる。
(というより、仮想メモリ不足となりハングした時と同じ状況になる)

oleexcel.plを佐藤さんのMLに従って変更後(私が実施したファイルは
元のcsvファイルが53000行×10列あったので、仮に100?100を
4000?10にしてみた)、368文書のインデックスに1ファイル追加の形で
テストしてみました。(コンソールlogはすっかり取り忘れました^^;)
c:\mknmz -a -U -O c:\namazu\var\namazu\index\・・・・ 
(nmz.field.size)
366 1053184
367 1568256
368 1837056
369 11168256 (←今回追加のkakaku.xls)
(nmz.field.uri)
366 /c|/Apache/qms/data/稟議回答.xls
367 /c|/Apache/qms/data/稟議回答3.xls
368 /c|/Apache/qms/data/稟議回答c.xls
369 /c|/Apache/qms/data/kakaku.xls

という報告になりますが、結果的には11MBのexcelファイルがインデックスに
追加されて、WEB上からも開ける事を確認しました。
conf.pl及びmknmzrcファイルのFileサイズを変更したとしても、oleexce l.plを
修正しないとサイズの大きいexcelファイル(中味による)は現実的には
うまくいかないと思います。

参考にでもなれば・・・
 try!again
原田@福岡<harada@xxxxxxxxx>