namazu-ml(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: 半角カナとSIを含む文書でインデックスがおかしくなる?



Takeshi ITOH <titou@xxxxxxxxxx> wrote:

>さっそく手元のメールのインデックスを作り直しましたが、検索にひっか
>かる筈のメールがひっからなくなりました。logを見てみるとどうも
>subject:に半角カナが含まれたメールがありそれ以降 nkf の出力モード
>が変ってしまったようです。(半角英数を SSO xx にする)

うちの環境でも再現しました。nkf171.shar 付属の NKF モジュー
ルを使っています。 nkf の問題だとすると Namazu側で対処するの
は難しいです。

第一発見者ということで伊藤さんの方でパッチを作って河野さんに
送るといいと思います。:)

ちなみに、 nkf 1.9 では次のような話題がありました。

[namazu 1182] 高久さん:

| > 対象となったhtmlの中の全角スペースがインデックス化された際に
| > 化けてしまっています。
| (…ばっさり略…)
| 
| > nkf version・・・1.9
| 
| ↑ これのせいじゃないでしょうか?
| どうも、nkfの挙動がおかしいです。
| 
| 1.62 .. 1.71 あたりだと、
| 
| % echo 'a a' | kakasi -ieuc -osjis -aE | nkf -emXZ1
| 
| ような感じでやると、「a a」の出力を得るのに、
| 
| nkf1.9になると、
| 「a a」の出力結果を出します。
|    ^^
|    (全角のままです。)
| 
| 多分、nkfのバージョンを1.7とかもう少し前のバージョンで
| 試してみてはいかがでしょうか?

-- Satoru Takabayashi