Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: kakasi での分かち時の長音の扱いについて教えてください



 From: Kudoh Wataru <kudoh@xxxxxxxxxxxxxxxxxxxx>
 Subject: [namazu-users-ja] Re: kakasi での分かち時の長音の扱いについて教えてください
 Date: Tue, 15 Jan 2002 09:19:21 +0900

 > 馬場さん>という処理を行っているからです。src/kakasi.c#kakasi_do() の中です。
 > 馬場さん>つまりそうなるのは現在のところは仕様ということになります。しかしな
 > 馬場さん>がら、やはり直せるようなら直しておいた方が良いかとおもいます。
 > 
 >   仕様というのであれば、仕方が無いですね。Kakasiをいじりたくは無いので、
 > 話術(仕様と言ってユーザを納得させる。ひらがな検索は無しとする。等)で
 > 何とかしたいと今は考えています。

KAKASI 用のメーリングリストには投げたのですが、以下のパッチを試し
てみてください。少なくとも長音の問題は解決できるかとおもいます。

--- src/kakasi.c    2001/09/02 11:43:21     1.20
+++ src/kakasi.c    2002/01/13 06:21:06
@@ -559,7 +559,13 @@
                } else if (c[0].c1 == 0xa5) {
                    ptype = 5;
                } else if ((c[0].c1 == 0xa1) && (c[0].c2 == 0xbc)) {
-                   ptype = 5;
+                   if (pctype == 5) {
+                       ptype = 5;
+                   } else if (pctype == 6) {
+                       ptype = 6;
+                   } else {
+                       ptype = 5;
+                   }
                } else {
                    ptype = 4;
                }

ただし、ひらがな一般の分かち書き問題は依然として残るので、十分では
ないかもしれません。


 > 馬場さん>し方に頭を悩ませるより、ひらがなだけからなる語で検索できるようにす
 > 馬場さん>るのは後回しにしてでも他にやること、つまりとにかくなんでもいいから
 > 馬場さん>動く全文検索システムを作るという目標があったので、こういう処理にし
 > 馬場さん>たという経緯があります。昔話ということで勘弁してください。
 >   私がお客に「ご要望の80%ならなんとかなります。しかし残り20%を実現す
 > るには倍の期間と金が掛かりますヨ」と説明しているのに、なんか似ている気がし
 > ます。

# 1996年当時は Namazu のような便利なものがなかったものですから...
--
馬場  肇 ( Hajime BABA )                  E-mail: hajime.baba@xxxxxxxxx
国立天文台 天文学データ解析計算センター
--