Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: ファイルが巨大...および excel.pl など



どうもありがとうございます
返事が遅れましたことをお詫びします。


> word7形式の日本語word書類を wvWareではうまく処理することが
> 出来ません。そのため filter/msword.plでwordのバージョンを
> チェックして、word7形式の場合はインデックスの対象にしていません。
> 
> 付属マニュアル msword.pl の項を参照すると
> 以下のようになっています。
> 
>  namazu-2.0.5/doc/ja/manual.html#doc-filter
> 
>  msword.pl 
>     Microsoft Word文書を扱う (日本語版は Word 97, 98, 2000) 
>     必需品: wvWare, lv 
>     代替品: doccat 

そうですか。時間があれば、私自身も対応を検討してみます。
現状は、余裕はありませんが...。

> > 次に、インデックス化のときに
> >   ファイルが巨大なので無視します。
> 
> $FILE_SIZE_MAX,  $TEXT_SIZE_MAX  の値を、適宜増やしてみてください。
> 
> うちでは、 $FILE_SIZE_MAX   = 10000000;
> となっています。

共に10M(10000000)でしたが、$FILE_SIZE_MAXを20M(20000000)にしたらOKで
した。何故なんだろう?おおもとは1MBか2MBなのに。

> > 最後はexcel.pl。
> > 最新の昨年12月の版にするとexcelファイルが未対応の形式になってしまいます。
> 
> namazu-2.0.5.tar.gz をmakeして、インストールせずに
> make checkすると、どうなりますでしょうか。
> 

make checkでは何も起こりません。
しかし、makeのときに多くのwarningが出ます。

ちょっと長くて申し訳ありませんが、こんな風に。

regex.c:355: warning: comma at end of enumerator list
regex.c: In function `nmz_re_set_syntax':
regex.c:405: warning: control reaches end of non-void function
regex.c: In function `print_mbc':
regex.c:479: warning: int format, long int arg (arg 2)
regex.c:481: warning: int format, long int arg (arg 3)
regex.c:483: warning: int format, long int arg (arg 3)
regex.c:483: warning: int format, long int arg (arg 4)
regex.c:485: warning: int format, long int arg (arg 3)
regex.c:485: warning: int format, long int arg (arg 4)
regex.c:485: warning: int format, long int arg (arg 5)
regex.c:487: warning: int format, long int arg (arg 3)
regex.c:487: warning: int format, long int arg (arg 4)
regex.c:487: warning: int format, long int arg (arg 5)
regex.c:487: warning: int format, long int arg (arg 6)
regex.c:489: warning: int format, long int arg (arg 3)
regex.c:489: warning: int format, long int arg (arg 4)
regex.c:489: warning: int format, long int arg (arg 5)
regex.c:489: warning: int format, long int arg (arg 6)
regex.c:489: warning: int format, long int arg (arg 7)
regex.c:492: warning: unsigned int format, long unsigned int arg (arg 2)
regex.c:495: warning: int format, long int arg (arg 2)
regex.c:495: warning: int format, long int arg (arg 3)
regex.c: In function `nmz_re_compile_pattern':
regex.c:1385: warning: suggest parentheses around arithmetic in operand of |
regex.c:1409: warning: suggest parentheses around && within ||
regex.c:1447: warning: implicit declaration of function `nmz_scan_hex'
regex.c:1455: warning: implicit declaration of function `nmz_scan_oct'
regex.c:1463: warning: suggest parentheses around arithmetic in operand of |
regex.c:1582: warning: subscript has type `char'
regex.c:1584: warning: subscript has type `char'
regex.c:1584: warning: subscript has type `char'
regex.c:2050: warning: subscript has type `char'
regex.c:2052: warning: subscript has type `char'
regex.c:2052: warning: subscript has type `char'
regex.c:2237: warning: enumeration value `unused' not handled in switch
regex.c:2237: warning: enumeration value `exactn' not handled in switch
regex.c:2237: warning: enumeration value `begline' not handled in switch
regex.c:2237: warning: enumeration value `endline' not handled in switch
regex.c:2237: warning: enumeration value `begbuf' not handled in switch
regex.c:2237: warning: enumeration value `endbuf' not handled in switch
regex.c:2237: warning: enumeration value `endbuf2' not handled in switch
regex.c:2237: warning: enumeration value `on_failure_jump' not handled in switchregex.c:2237: warning: enumeration value `push_dummy_failure' not handled in switch
regex.c:2237: warning: enumeration value `succeed_n' not handled in switch
regex.c:2237: warning: enumeration value `try_next' not handled in switch
regex.c:2237: warning: enumeration value `finalize_push' not handled in switch
regex.c:2237: warning: enumeration value `finalize_push_n' not handled in switchregex.c:2237: warning: enumeration value `set_number_at' not handled in switch
regex.c:2237: warning: enumeration value `anychar' not handled in switch
regex.c:2237: warning: enumeration value `anychar_repeat' not handled in switch
regex.c:2237: warning: enumeration value `charset' not handled in switch
regex.c:2237: warning: enumeration value `charset_not' not handled in switch
regex.c:2237: warning: enumeration value `start_memory' not handled in switch
regex.c:2237: warning: enumeration value `stop_memory' not handled in switch
regex.c:2237: warning: enumeration value `start_paren' not handled in switch
regex.c:2237: warning: enumeration value `stop_paren' not handled in switch
regex.c:2237: warning: enumeration value `casefold_on' not handled in switch
regex.c:2237: warning: enumeration value `casefold_off' not handled in switch
regex.c:2237: warning: enumeration value `posix_on' not handled in switch
regex.c:2237: warning: enumeration value `posix_off' not handled in switch
regex.c:2237: warning: enumeration value `start_nowidth' not handled in switch
regex.c:2237: warning: enumeration value `stop_nowidth' not handled in switch
regex.c:2237: warning: enumeration value `pop_and_fail' not handled in switch
regex.c:2237: warning: enumeration value `duplicate' not handled in switch
regex.c:2237: warning: enumeration value `wordchar' not handled in switch
regex.c:2237: warning: enumeration value `notwordchar' not handled in switch
regex.c:2237: warning: enumeration value `wordbeg' not handled in switch
regex.c:2237: warning: enumeration value `wordend' not handled in switch
regex.c:2237: warning: enumeration value `wordbound' not handled in switch
regex.c:2237: warning: enumeration value `notwordbound' not handled in switch
regex.c:1114: warning: `c1' might be used uninitialized in this function
regex.c: In function `bm_init_skip':
regex.c:2536: warning: subscript has type `char'
regex.c: In function `nmz_re_search':
regex.c:3095: warning: suggest parentheses around arithmetic in operand of |
regex.c: In function `nmz_re_match':
regex.c:3631: warning: suggest parentheses around arithmetic in operand of |
regex.c:3760: warning: suggest parentheses around arithmetic in operand of |
regex.c:4092: warning: label `pop_loop' defined but not used
regex.c: At top level:
regex.c:2413: warning: `insert_op' defined but not used
regex.c:939: warning: `print_compiled_pattern' defined but not used

------------------------------------------------
北川文孝
E-mail : kitagawa@xxxxxxxxxxxxxxxxxx