Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: mhonarcで作成されたHTMLでnamazuを動作させる方法が分かりません。



寺西です。

matuura wrote:
> 
> MHonArc v2.6.8、Namazu 2.0.12を利用しています。
> 今現在 MHonArcでメールをHTML化して
> namazuで検索出来るようにしているのですが
> HTML化された日本語が
> TVの&#x4EF6
> という文字になってしまいnamazuで検索出来るようにする方法が分かりません。
> 
> MHonArcのリソースファイルで日本語にする際に関係ありそうな部分は
> --------------------------
> <DECODEHEADS>
> <MIMEARGS>
> text/plain:default=iso-2022-jp
> </MIMEARGS>
> <CHARSETCONVERTERS>
> plain; iso_2022_jp::str2html; iso2022jp.pl
> </CHARSETCONVERTERS>
> <NOMAILTO>
> <DEFCHARSET>
> iso-2022-jp
> </DEFCHARSET>
> --------------------------
> 以上のようにやっております。

あまりに有名な話ですが、
mhonarc 2.6 以降では、以下のものを .mhonarc.mrc に記述します。 

<CharsetConverters>
iso-2022-jp;    iso_2022_jp::str2html;     iso2022jp.pl
</CharsetConverters>

ですので、



<DECODEHEADS>
<MIMEARGS>
text/plain:default=iso-2022-jp
</MIMEARGS>
<CHARSETCONVERTERS>
plain;          iso_2022_jp::str2html;     iso2022jp.pl
iso-2022-jp;    iso_2022_jp::str2html;     iso2022jp.pl
</CHARSETCONVERTERS>
<NOMAILTO>

にしてみましょう。

> mknmzrcでは
> --------------------------
> $KAKASI = "module_kakasi -isjis -oeuc -w";
> $WAKATI = $KAKASI;
> --------------------------
> とやっております。

としてはいけません。

> 「-isjis」としたのはインターネットエクスプローラのエンコードの部分が
> SHIFT-JISになっていたためです。
> ココを-iiso-2022-jpとかやれば良いのでしょうか?

-ieuc に戻しましょう。意味もわからず勝手に書き換えてはいけません。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E