Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: EUC-JP strings in perl scripts



パッチを作った張本人です.

>>>>> On Tue, 27 Jan 2004 18:19:40 +0900,
>>>>> "knok" == knok@xxxxxxxxxxxxx wrote:

>> これに対する解になるのかどうかはわかりませんが、
>> red-hatのpatchではEUC-JP部分をtextファイルとして外に出しているようです。
>> http://ftp.kddilabs.jp/Linux/packages/fedora/core/1/SRPMS/namazu-2.0.12-6.src.rpm
>> fedoraのnamazu-2.0.12-6.src.rpmに入っている
>> namazu-2.0.12-fixinutf8.patchをもらってみてはどうでしょう。

knok>   このパッチ自体はずいぶん前にもらっていたのですが、いまの今までなかを
knok> 見ていませんでした。分離しつつ、utf8 の物も別途用意しているのですね。
knok> とりあえずはこれをそのまま入れてしまってもいいかなあ、とも思うのですが、
knok> どうせなら langspec.txt は utf8 に統一してしまって、日本語以外の情報も
knok> その中に入れられるようにして、適時 encoding 変換をする、という形にする
knok> とより汎用的かなあ、という気もします。

大がかりなhackをする時間もなくかなりad hocな解決方法をとって
しまったと自分では思っているんですが,何かもっといい方法があ
るんじゃないかと思いつつ時間もなく放置してしまってました.
このパッチをupstreamで採用するにあたって問題点は,文字列とそ
れが適用される場所の見通しが悪いということと,野首さんがおっ
しゃるような他の言語も追加となるとUTF-8に限っては複数の言語
が混じってしまい,どちらにしてもメンテナンス性が悪くなると思
います.
また,regexpをそのままなので,単純に例えば翻訳者がそれをみて
正しく動作するものが出てくるかというところにもやや疑問を感じ
ますし,もうちょっと考えてみてもいい部分ではないでしょうか?
このへんの文字列を簡単に追加できるようなしくみも必要だったり
しませんかね? そういうのを各言語とencoding毎に保存して…とか.


--
Akira TAGOH  : tagoh@xxxxxxxxxxx  / Japan GNOME Users Group
at@xxxxxxxxx : tagoh@xxxxxxxxxxxx / GNOME-DB Project
             : tagoh@xxxxxxxxxx   / Red Hat, Inc.
             : tagoh@xxxxxxxxxx   / Debian Project