[Namazu-users-ja 189] Re: mknmzでの「^?」の扱いについて

Tadamasa Teranishi yw3t-trns @ asahi-net.or.jp
2005年 1月 15日 (土) 23:57:19 JST


寺西です。

hisatomo @ ctc-g.co.jp wrote:
> 
> > Namazu では 0x7f は内部で特殊な意味を持たせています。
> > # こういう仕様もどうだかと思うけど。
> >
> > このため、0x7f が含まれる文書を処理した場合、0x7f 以降の文字は
> > ばっさりと削除されるようです。
> 
> これは、0x7fに限らず、0x00〜0x1fまでの制御文字に関して
> すべて上記の動作となりますでしょうか?

いいえ。0x7f のみです。

ただし、制御文字が多すぎるとテキストファイルであっても、それを
バイナリファイルと誤認する可能性があります。
バイナリファイルと誤認された場合は、インデックスの対象外として
skip されます。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns @ asahi-net.or.jp
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E




Namazu-users-ja メーリングリストの案内