Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: 検索結果の文字化け



<20010322172545A.baba@xxxxxxxxxxxxxxxxxxxxxx>の記事において
baba@xxxxxxxxxxxxxxxxxxxxxxさんは書きました。

>>  > ところでこの環境でインデックスを作成するときに出力されるメッセージなので
>>  > すが、Writing index files... と英語でメッセージが表示されます。
>>  > これはnamazuサイト上にあった環境変数LANGの設定誤りにあたるようですが。
>> 
>> そうです。

  しかしながら、

<3AB9AF87.3090604@xxxxxxxxxxxxxx>の記事において
hirata@xxxxxxxxxxxxxxさんは書きました。

>> 早速、mknmz -Cを実行したところ、次のような結果になりました。
>> --
>> System: linux
>> Namazu: 2.0.5
>> Perl: 5.00503
>> NKF: module_nkf
>> KAKASI: module_kakasi -ieuc -oeuc -w
>> ChaSen: no -j -F '%m '
>> Wakati: module_kakasi -ieuc -oeuc -w
>> Lang: ja_JP.ujis
>> Coding System: euc

  これをみるとなんとなく大丈夫そうなんですよね... もしかすると、index
を作成した時と同じ環境ではないのかもしれませんが。
  もしそうであれば、単に index を一から作りなおせば直るかもしれません。

  馬場さんのメールに戻りますが、

<20010322172545A.baba@xxxxxxxxxxxxxxxxxxxxxx>の記事において
baba@xxxxxxxxxxxxxxxxxxxxxxさんは書きました。

>> 前からぼんやりと考えていたことですが、mknmz 実行時に LANG=ja でな
>> いと KAKASI, NKF その他を利用しないようになっていますが、これはや
>> はり不親切というか混乱気味であるような気がしてきたのですがどうでしょ
>> うか。つまり、表示メッセージを日本語にするかどうかを LANG (その他)
>> で制御できるのは良いでしょうが、KAKASI や NKF を通すかどうかまでが 
>> LANG に制御されるのはどうなんだろうかということです。

  私もこの点は気担っていました。こういったことは、何かの規格で規定
されていたりするものなのでしょうか?

>> というようになっているように、mknmz の進行メッセージが英語でも 
>> KAKASI,NKF を通せるような(あるいは逆の)枠組みがあってもいいんでな
>> いかという気はします。

  さらにもう少しすすめて、なんらかの方法で index 対象のファイルがどの
言語/encoding のデータとして扱うべきかを指定できると、多国語化/国際化
に近付けるのではないかとも思ってたりします。
  具体的なアイディアを持っていないのがヨワいですが...
-- 
野首 貴嗣
E-mail: knok@xxxxxxxxxxxxx