[Kakasi-dev 46] Re: mkkanwa の辞書登録における問題点
Tadamasa Teranishi
yw3t-trns @ asahi-net.or.jp
2006年 4月 18日 (火) 15:43:24 JST
寺西です。
NOKUBI Takatsugu wrote:
>
> At Mon, 17 Apr 2006 17:23:51 +0900,
> Tadamasa Teranishi wrote:
> > よみとして適当ではないので、「ヵ」「ヶ」に関しては登録しなくて良いと
> > 思います。
>
> パッチを書いてみました。問題なさそうならコミットします。
問題ないと思います。
> ただ、JIS X 0213:2004をみると、どうやらこれらの文字のひらがな版が新
> 規に追加されているようです。
...
> 他にも「かきくけこ」の半濁点つきなんかが追加されています。実際のとこ
> ろ使えるシステムは限られていると思うので、とりあえずは考えないでおきま
> す...
kakasi はプログラムの内部では
JIS78 (旧JIS)
JIS83 (新JIS)
という区別になっていますが、kakasidict に「凜」「熙」が含まれること
から新JISは 1990/1997 の拡張を含んだものまで扱うという仕様と思われ
ます。
# この2文字をメールに書いて大丈夫か!?
しかし、EUC-JP の 3バイト文字(JISX0212)についても、現状一切考慮されて
いませんので、JIS X 0213 への対応は容易ではないでしょう。
内部処理を UTF-8 化する(ことがあれば)際に考えれば良いのではないか
と思います。
--
=====================================================================
寺西 忠勝(TADAMASA TERANISHI) yw3t-trns @ asahi-net.or.jp
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E
Kakasi-dev メーリングリストの案内