Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: 全角半角変換



  私もとりあえず思うところを書いてみます。

At Fri, 06 Jun 2003 17:45:57 +0900,
Yukio USUDA wrote:
> ただ、コード変換はどこが責任をもってするのか?、変換前コード名の
> 特定はどこでするのか?というところを整理したほうがよいと思ってい
> ます。

  CVS HEAD では filter 以外の処理(--html-split 相当の個所や非ファイル
対応など)も分離しているのですが、同様に言語に関わる処理も分離すべきで
はないかと思っています。
  とはいえ、フィルタがからむと難しいですね...

  本当は、内部で処理されるデータに言語情報をもたせ、

* 読み込み処理の範疇で言語/encoding が判明した場合
* filter 処理で判明した場合

  それぞれに対応できるようにするのが良いのかな、という気がしています。

  前者はたとえば、HTTP で取得したときに得られる charset パラメータが該
当するでしょうし、後者は HTML 内に記述されている meta tag の内容で決定
される場合が一例となるでしょう。

  現状は単に binary stream を変数の reference で渡しているだけですが、
そういった構造的なところから手をいれないといけないかなあ、と漠然と考え
ていました。

  2.1 でそこまでやるのは無理ですかね...

> といった対応を考えたのですが、APIが変わるのを気にしなければAが
> シンプル。(現在の$$$$$という引数は既に多いような気がしますが)

  2.1 に関しては、API の変更はあまり気にしなくても良いかなと思ってはい
います。
-- 
野首 貴嗣
E-mail: knok@xxxxxxxxxxxxx
	knok@xxxxxxxxxx / knok@xxxxxxxxxx