Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: EUC-JP strings in perl scripts



At Tue, 27 Jan 2004 19:27:47 +0900 (JST),
Akira TAGOH wrote:
> また,regexpをそのままなので,単純に例えば翻訳者がそれをみて
> 正しく動作するものが出てくるかというところにもやや疑問を感じ
> ますし,もうちょっと考えてみてもいい部分ではないでしょうか?
> このへんの文字列を簡単に追加できるようなしくみも必要だったり
> しませんかね? そういうのを各言語とencoding毎に保存して…とか.

  実際にこれらが適用されるのは、man の出力や mail の cite といったとこ
ろをいじる箇所なので、言語ごとに大きく異なるところだとは思います。
regex だけでなく、コードレベルでも手を入れる必要ももしかするとあるかも
しれません。

At Wed, 28 Jan 2004 00:15:52 +0900,
Tadamasa Teranishi wrote:
> (.pl の中に書いてあるものだけですよね? .c に書いてある方も問題だとは
> 思いますがこちらはとりあえず関係ない!?)

  はい、.pl の方だけを問題にしています。

> パッチの中身を見ずに書くのも何ですが、
> EUC 前提の mknmz に utf8 の物を別途用意していて、うまくいくような
> 仕組みが仕掛けられているのですか?

  util.pl に新たな関数を用意し、id に対応する text にかかれた文字列を
取得するような形になっています。なので、そこで encoding の変換も同時に
行うことはできそうです。

> > どうせなら langspec.txt は utf8 に統一してしまって、日本語以外の情報も
> > その中に入れられるようにして、適時 encoding 変換をする、という形にする
> > とより汎用的かなあ、という気もします。
> 
> うーんと、詰め込んじゃうのはダメなんではないかと思いますが。

  現状 pl/ 以下に langspec.txt や langspec.txt-ja といったファイルが保
持されているので、そこにファイルが増えるのはちょっといやだなあ、という
感覚がありました。むしろ langspec/ja.txt というように別途ディレクトリ
を増やして言語ごとに保存する方が良いですね。

  別解として、gettext を使うことも考えてみたのですが、こういう用途に用
いるのはどうなんでしょう... やっぱり違うかな。
-- 
野首 貴嗣
E-mail: knok@xxxxxxxxxxxxx
	knok@xxxxxxxxxx / knok@xxxxxxxxxx