namazu-dev(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Namazu for Win32 binary snap release 20000215



白井です。

isdigit の話と sjis なメールの mknmz の話は全然違う(のじゃないか
な?と勝手に思っている)ので、元の山下さんのメールからはじめさせ
ていただきます。^^;;;

From: Seiji Yamashita <s_yam@xxxxxxxxxxxx> さん曰く
Subject: [namazu-dev 1707] Re: Namazu for Win32 binary snap release 20000215
Message-ID: <200002200831.RAA23373@xxxxxxxxxxxxxx>
Date: Sun, 20 Feb 2000 17:30:05 +0900

山下>  これなんですが、シフトJIS のテキストファイルに対して mknmz すると、なん
山下> だかおかしいような気がします。
山下> 
山下>  というのは、search-s Plug-in を作っていて気付いたのですが、
山下> nmz1915-20000215.exe で mknmz したもので、メール(AL-Mail32 で保存されてい
山下> る形式 = シフトJIS) を検索すると、Subject: のものしかインデックスが作成さ
山下> れていないようです。

# AL-Mail は 16bit 版の頃に使っていました。懐かしいです。

From: Hideyuki SHIRAI (白井秀行) <shirai@xxxxxxxxxxxxxxxxxxx> 曰く
Subject: [namazu-dev 1718] Re: Namazu for Win32 binary snap release 20000215
Message-ID: <200002201336.WAA29278@xxxxxxxxxxxxxx>
Date: Sun, 20 Feb 2000 22:33:32 +0900 (JST)

白井> 広瀬> > これなんですが、シフトJIS のテキストファイルに対して mknmz すると、なん
白井> 広瀬> >だかおかしいような気がします。
白井> 
白井> これ、試してみたら私もそうなりました。ただし、良く考えたら今まで
白井> sjis な file を mknmz したことがないので、いつからの現象かはわか
白井> りません。

私もこのように *だめだめ* になったのですが、

山下>  コマンドラインは、mknmz --all . や mknmz --mailnews ... などを使いまし
山下> た。

これがいけないようです。

From: 小関 吉則 (KOSEKI Yoshinori) <kose@xxxxxxxxxxxxxxxxxx> さん曰く
Subject: [namazu-dev 1737] Re: isdigit (Re: Namazu for Win32 binary snap release 20000215)
Message-ID: <200002210557.OAA29352@xxxxxxxxxxxxxx>
Date: 21 Feb 2000 14:59:23 +0900

小関> From, Subject で b-encode した ISO-2022-jp と、本文を
小関> SJIS で保存したものの混在ってのが、原因ってことはないでしょ
小関> うか?

そう言われれば、そうだよなぁと思い、(B|Q)-encode を解いて sjis
で書いても *だめだめ* だったのですが、自動認識や --mailnews の設
定を止めて、

% mknmz --media-type=plain/text (以下略)

としたら、ちゃんとした INDEX が出来ました。

## ただし、NMZ.field.from は全部『不明』なのですけどもね。:-)

というわけで、sjis な text がダメというわけではなくて、Mail,
News と見なされるもので sjis にコード変換したものがダメなようで
す。また euc-jp に変換すると --mailnews でも、From: Subject: 等
が (B|Q)-encode されていても大丈夫だったりしました。

以上すべて、WinNT 上の話でして、Perl module はすべて、広瀬さんの
nmz1915-20000215.exe でインストールされたものです。

また、UNIX では euc-jp だろうが、sjis だろうが問題ないようです。

# だけど、From: が " で quote されちゃうみたい。

-- 
白井秀行 (mailto:shirai@xxxxxxxxxxxxxxxxxxx)