[Namazu-users-ja 188] Re: mknmzでの「^?」の扱いについて

hisatomo @ ctc-g.co.jp hisatomo @ ctc-g.co.jp
2005年 1月 15日 (土) 23:40:32 JST


寺西様

お世話になっております。田中です。
ご回答ありがとうございました。

下記、ご教授頂いた内容につきまして
インラインにてお伺いさせてください。

> > mknmzによってIndex化をする際、
> > 対象ファイル内の文字列に”^?”(Deleteでしょうか)が
> > Index化対象ファイル内に存在すると
> > その他の文字列がうまくIndex化されないようです。
> > 
> > 現象としては、対象ファイル内(日本語は含まれておりません)に
> > ”^?”文字列発見後は以降の文字列を
> > Index化をしていないと思われます。
> 
> Namazu では 0x7f は内部で特殊な意味を持たせています。
> # こういう仕様もどうだかと思うけど。
> 
> このため、0x7f が含まれる文書を処理した場合、0x7f 以降の文字は
> ばっさりと削除されるようです。

これは、0x7fに限らず、0x00〜0x1fまでの制御文字に関して
すべて上記の動作となりますでしょうか?

>  
> > また、”^?”がファイル内に存在する際にも”^?”も含めファイル内の
> > すべてをIndex化するためにはどのようにしたらよろしいでしょうか?
> 
> 制御コードは全て空白文字として扱いますので、0x7f を含めて検索
> することは仕様上できません。
> ただし、
> 0x7f を空白に置換した上で処理するようにバグ修正した場合には、
> 0x7f 以降の文字列も処理されるようになるでしょう。
> 
> > Namazu
> >         2.0.13
> 
> 本件とは関係ありませんが、Namazu 2.0.14 を使いましょう。

以上、大変お手数ですが、
ご回答の程宜しくお願い申し上げます。

田中 久智



Namazu-users-ja メーリングリストの案内