Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: namazu.cgi causes SIGSEGV when $MAX_FIELD_LENGTH==1000 (namazu-bugs-ja#50)



<87lmpu9qko.wl@xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx>の記事において
fumiya@xxxxxxxxxxxさんは書きました。

>> 特定の文書のサマリーの読み込みでは落ちて、ほかの文書のでは
>> 落ちない、ということです。不明確な書き方でした、すみません。

  了解です。

>> 再現できるインデックスを作ろうとしている途中で、もう一点
>> 気になることに気づきました。問題が発生するインデックスは、
>> mknmz 実行時には環境変数 LANGUAGE, LC_ALL, LC_MESSAGES, 
>> LANG が設定されていない状態になっていて、namazu.cgi 実行時は
>> 環境変数は同様ですが namazurc で Lang ja と指定してあります。
>> インデックス対象の文書には日本語が含まれています。
>> 
>> 日本語のわかちがきがされず、日本語コードが EUC-JP に統一され
>> ないで NMZ.* に格納されていることになりますね…。

  状況は理解できました。誤った使われ方になるとは思うのですが、それでも
segfault はまずいですね...

>> 本件に関係ないが気になった点:
>> 
>>   * mknmz は LC_MESSAGES が ja になっていると日本語のわかち
>>     がきの処理を実行するようなるが、これは変。

  これは最近 users-ja でも話題になりましたね。この辺りの環境変数による
挙動の変化というのは、どこで規定されているものなのでしょうか? POSIX?

>>   * mknmzrc で MAX_FILED_LENGTH を増減させると、
>>     namazu.cgi が表示するサマリほかにも影響する。特に
>>     サマリは namazu.cgi 側で表示量を調整できるようにしたいなぁ。

 そうですね。

# うう、bug が溜るばっかりだ...
-- 
野首 貴嗣
E-mail: knok@xxxxxxxxxxxxx