Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: メール、ニュースの添付ファイルの内容もインデックス化可能ですか。



渡辺です。
野首様、ご回答ありがとうございました。

NOKUBI Takatsuguさんの記事
<200104280639.PAA03635@xxxxxxxxxxxxxxxxxx>から
----------------------------------------------------------------
>  テキスト部分と添付データをテキストに変換したものを単純に繋げて、それ
>をインデックス化する、というよう処理をするように filter/mailnews.pl を
>修正することは(がんばれば)可能かもしれません。

ということは、添付ファイルは通常MIMEエンコードされていますから、

・添付ファイルをデコード
・テキストの抽出
・メール(記事)本文と連結
・インデックス化

という手順になるわけですね。
それから、今考えてて分かったのですが、実装する上で更に問題があることに
気が付きました。

というのは、当然、検索できたものに関しては現物(エクセル・ワードファイ
ル)を参照したいのですが、それらが検索結果から容易にアクセスできるよう
にする方法も考えてやらないといけないわけですね。

かなりハードルが高いことに気づき、ちょっと意気消沈しそうですが、なにか
いい打開策がないか、いろいろと考えてみようと思います。ありがとうござい
ました。

-- 
渡辺 英史
mailto:hwatanab@xxxxxxxxxxxxxxxxx