namazu-dev(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: File::MMagic



knok@xxxxxxxxxxxxx (NOKUBI Takatsugu) wrote:

>> なるコードが見つかりましたが、この 2つは区別しないで 
>> text/rfc822 にまとめてしまえばいいんじゃないでしょうか?
>
>  うーん、IANAに登録されているmedia typeはrfc822とnewsに分けてあるので、
>できれば種別としては分けておきたいです。File::MMagic自体はNamazu専用と
>いうわけではなく、一般的なmedia typeを返すようにしたいので...

なるほど。では Namazu側で rfc822 と news を同一視することにします。


># そんなわけで、これをCPANに登録してみました。

お、いいですね。海外の方からの反応はありました?


>> # .tar.gz を扱えると嬉しいかな? 検索結果は 
>> # /somewhere/foo.tar.gz#filename みたいな感じで出力する仕様
>> # にして。これができるなら HTML の <a name="foo"> にも対応で
>> # きると思う。 (実装はちと難しそうですが)
>
>  これは私もちょっと考えました ^^; ただ、これはフィルタ処理の範疇では
>なく、ファイル以外のデータを検索対象にする仕組みが必要だと思います。

あ、そういえばそういう話がありましたね。忘れていました。


>  こちらについてはまだあまり考えがまとまっていないのですが、とりあえず
>
>・データの指示方法
>	(URI的な指示方法が良い?)

これがよいでしょう。 (http|ftp|news):// はすべて lynx -dump 
に任せればよいですね。リストを mknmz -F に渡す形式で対応すれ
ばよいかな。再帰的な取得は考えなくてもよいでしょう、面倒だか
ら。 (あらかじめ wget なりで取得しておきましょう)


> File::MMagic::checktype_filenameはちょっと使えないかもしれません。手
>元のバージョンではchecktype_contentsという関数も実装したので、そちらが
>使えるでしょう。

了解しました。

p.s.
今日は [namazu-dev 17] の実装に取り組むつもりです。

-- Satoru Takabayashi