Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Namazu 2.0.6rc2 for Win32 Test Release



  本当は、できることなら nkf から脱脚したいとも思っています ^^;

  現状では nkf だけでなく、filter によっては lv を利用しています。似た
ような用途に似たような software を複数利用する現状はあまりよくないなあ、
と常々感じていました。

<20010716144833Y.takesako@xxxxxxxxxxxxxxxxxxxxxxxxxxxxxx>の記事において
takesako@xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxさんは書きました。

>> # 少ない確率ですが,Sfhit_JIS と EUC_JP のコードが重なってしまって
>> # いる文字だけから構成される文書に対しては自動判定できないはずです.

  これはそうですね。自動変換は常にこの危険性をはらんでいます。いわゆる
半角カナに積極的に対応しようとしている現状ではなおさら。

>> あと,namazu の多言語化を考えた場合,対象文書毎に charset を取得して,
>> その情報を元に内部エンコーディングに変換しないと,うまくいかないと
>> 思います.個人的には,現状の namazu 2.x で多言語文書の対応は難しいと
>> 考えているので,Namazu 3 での課題にするのが良いかと思われます.

  lv はかなり賢い encoding guess を行なうそうで、UTF-8 や日本語以外の
encoding もそれなりに推測してくれます。lv の作者である NARITA さんは、
lv を library 化することも検討して下さっているので、個人的には nkf か
らこちらに移行できないかと考えていました。

  Namazu 2.2.x を作ろうとしている現状では、できるだけ 3.x に向けて
design の指針となりえるものにしたいと思っています。なので、ad-hoc な方
向に安易に進むのもいかがなものかな、と。

# とはいえ、理想を追及しすぎると実用性を欠くので、適度なバランスを保つ
# 必要があるとも思っています。
-- 
野首 貴嗣
E-mail: knok@xxxxxxxxxxxxx
	knok@xxxxxxxxxx / knok@xxxxxxxxxx