Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Subject field search bug when NULL character is contained



寺西です。

TSUCHIYA Masatoshi wrote:
> 
> >多分デコードして途中に NULL 文字が入っていると、そこまでの文字列とみ
> >なして subject に登録するので、登録された subject の途中にNULL 文字が
> >入っていることはないでしょう。
> 
> Perl は NULL 文字が入っていても,普通の文字列として扱いますから,寺西
> さんの期待は成り立たないと思います.

Perl がそうなのは知っているのだが、
mknmz 側で null ターミネートの C String として扱うようにはなって
いなくて、そのまま出力しているわけですね。

それはそれで問題なので、null ターミネートの C String として扱うように
修正すべきですね。文字列の出力部分はすべて。

> とのことなので,明示的に制御文字とか NULL 文字を削除する処理が必要なの
> ではないでしょうか.

最終的には
インデックスには制御文字とか NULL 文字を含まないようにするのが
良いですかね。
 
> いずれにしても,対策されていない mknmz によって作成済みのインデックス
> を扱う場合があることを考えると,namazu 側でも適切な回避策を実装してお
> くことは,無駄ではないと考えます.

無駄ではもちろんないです。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E