Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: multipart内のファイルのインデックス化



臼田です。

Tadamasa Teranishi wrote:

> デコードするしないにかかわらず、ファイル名をせっかく切り出したのなら、
> それを検索対象に入れておくのは良いと思います。

特定のfieldに加えるのがよいのかもしれませんが
添付ファイルの本文の後ろにファイル名を加えることにしてみました。


> > 拡張子だけ無事であればよいと考えておりました。
> > (渡した先のフィルターで本文に追加していれば入ってしまいますが)
> > このあたりは改善の余地ありです。
> 
> たぶん、タイトルにも使われるのではないかと思います。
> # 実はまだ multipart の処理をきちんと検証できていません。
> # ごめんなさい。

mailnews.plから呼び出したフィルタが返す値のうち
$$contrefをメール本文に追加しているだけで
他の引数は使っていません。


> > 複数行にデコードされるようなURIを持った添付ファイルが
> > ちゃんと処理できるのかなどはサンプルを作って
> > 検証をする必要がありそうですね。
> 
> はい。とってもバラバラなところなので、検証するのが大変ですが、
> こっちでも、サンプルをいろいろ作ってみようと思います。

MS-Windows系のメーラだけですが
AL-Mail : Content-Dispositionを複数行に分けてMIME Bエンコードする例 
Edmax  : RFC2231でエンコードしたMIMEヘッダの例
Mozilla : Content-DispositionをSJISでMIME Bエンコードする例

の3種類のメーラで
・とても長い日本語名のファイル
・とても長いASCII名のファイル
・短い日本語名のファイル
・短いASCII名のファイル
を添付したサンプルを作りました。

上記のタイプについてはファイル名が取得できるようにしてcommit
しました。
他にも違った形式のサンプルを入手できれば対応しようと思います。

臼田幸生