namazu-ml(avocado)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Non wakatigaki



かわとです。

□■ Satoru Takabayashiさんから 11月26日(Thu)16時47分頃に頂いたメイル、
■□『 [namazu:01663] Re: Non wakatigaki 』より。
>安易な方法としては現状でも 『*ひらがな*』 のように両側にアスタリス
>クをつければひらがなの語も検索できます。

はい、短期的にはそれで妥協せざるをえないかなぁと思っています。これ
だとchasenよりはkakasiの方が向いているのでしょうね。

でも、漢字/平仮名が混在したキーワードに対して辛くなりませんかね?
(ヒットもするだろうけど、誤ヒットも増える? そんなことはない!?)
まぁ当たらないよりはましなので、ゴミが増えても我慢してもらうことに
なるでしょうけど。

--

>ただ、 Namazuのフレイズ検索の精度では今度は逆に「存在しない単語が
>見つかってしまう」事態が発生します。2文字づつ登録すれば少しはまし
>になるかもしれませんが。

なので、そこが先程のメールに書いていた「繋がりに意味を持たせる」と
いうところで、何らかの方法で出現順や隣接情報まで覚えさせられれば、
ウソの結果を出す確率は大幅に減るとは思います。問題は、その情報を
どう持たせるか、というところですけど…。

># 辞書を使わない方式だと『林哲』で検索して『高林哲』がヒットしてし
># まう弊害もあります。気にするほどの問題ではないと思いますが。

私の出した要望の方向で考えれば、これは仕方がないでしょうね(^^;

#grepでは日常茶飯事だし(^^;;;
------------------------------------------------------------------
 -- 川戸 勝史(KAWATO Katsushi) --       <kawato@xxxxxxxxxxxxxxxx>
                (株)NEC情報システムズ・情報インターネットSI事業部
------------------------------------------------------------------