Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: mknmz で HTML メールを index 化したい



<p04320403b6c0d5f7b8b2@[192.168.0.12]>の記事において
taon@xxxxxxxxxxxxさんは書きました。

>> namazuシステムをメールスプールの検索に使う場合の質問です。
>> メールがプレーンテキストだとうまくいきますが、
>> その中にHTMLメールがあるとヘッダー部分しかindex化されません。

  この部分の理由はちょっとよくわからないのですが(多分適切でない filter
が呼ばれている?)

>> HTMLメールまでindex化しようとして、mknmzのオプションで
>> --media-type='plain/text'とするとうまくできますが、
>> サマリーが汚いし、どういうわけか、データベースの
>> NMZ.field.subjectがメールヘッダーのSubjectになりません。

# 'plain/text' は 'text/plain' ですよね?

  こちらはわかります。--media-type='message/rfc822' で Subject をきち
んと拾うことができるはずです。

  ただ、HTML な mail の中身を適切に扱うことは今のところできないです。
そういう filter を作成する必要があるでしょうね。

# 実装は面倒かな、と思ったけど singlepart な mail ならそうでもないかも。

>> namazuのバージョンは2.0.4、slackware 7でlinux 2.2.13です。

  Namazu とは関係ないですけど、security 的な問題があるので 2.2.18 に上
げた方が良いですよ。2.2.13 だといくつか問題があったはず...
-- 
野首 貴嗣
E-mail: knok@xxxxxxxxxxxxx