namazu-ml(avocado)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: 初めまして&全角中グロについて質問です



塩崎です。

[On Nov 26, Masakazu Hanawa <hanawa@xxxxxxxxx> writes:]
>
>早速で申し訳ありませんが、"・"(全角の中グロというのかな?)の扱いについ
>て質問です。

これはわかち書きをどうしているかによると思います。

>●Namazu mailing list archives(Namazu v1.3.0.0)
>(http://avocado.aichi-u.ac.jp/%7Ealias/namazu/)
>参考ヒット数: { [ ビル: 8 ] [ ・: 0 ] [ ゲイツ: 0 ] :: 0 } 
> →中グロはヒットしない

これはおそらくkakasiでわかち書きされているのでしょう。
手許のkakasiで「ビル・ゲイツ」を試してみると「ビル . ゲイツ」になります。
ですから、そもそも「・」はインデックスには現れないはずです。

>●パシフィック・ハイテック(Namazu v1.2.0.1)
>(http://www.pht.co.jp/cgi-bin/namazu.cgi)
>参考ヒット数: 
>     tlj-general-ml: { [ ビル: 1 ] [ ・: 258 ] [ ゲイツ: 0 ] :: 0 } 
> →中グロはヒットする

これはchasenあるいはkakasi+自前パッチでわかち書きされているのではないか
と思われます。
「・」がちゃんと現れるようなわかち書きをしているのでしょう。

>●日経インターネットテクノロジー(Namazu v1.1.2.2)
>( http://nit.nikkeibp.co.jp/cgi-bin/namazu.cgi)
>参考ヒット数: [ ビル: 9 ] [ .: 1158 ] [ ゲイツ: 0 ] 
> →中グロは半角ピリオドに変換されてヒットする

これはkakasiでわかち書きをしているのでしょう。
さらに「Namazuの変更履歴」
http://saturn.aichi-u.ac.jp/%7Eccsatoru/Namazu/ChangeLog.ja
によると、
	v1.2.0.2
		[08/27/1998]

		* 検索時に自前でわかち書きするようにした
とのことですので、それより古いここでは、検索文字列もkakasiでわかち書きさ
れて「.」に変換されているのだと思います。

# 個人的にはkakasiで記号が「(kigou)」に変換されちゃうのがちょっと嫌。

-- 
ただし、私は耳鼻咽喉が弱いので、会議は禁煙にしてください。
--
塩崎 毅彦(SHIOZAKI Takehiko)	<takehi-s@xxxxxxxxxxx>
Technical Center,	ASCII CORPORATION