namazu-dev(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Recognize RFC document (Re: File::MMagic)



knok@xxxxxxxxxxxxx (NOKUBI Takatsugu) wrote:

>  とりあえず、%SPECIALSに次のようなエントリを足して実験してみました。
>
>		 "text/plain; x-type=rfc" => [
>			      "Network Working Group",
>			      "Request for Comments:",
>			      "Obsoletes:",
>			      "Category:",
>			      "Updates:",
>				   ],
>
>  多くの場合は判別できるものの、HTML, Mail, News等に言及しているRFCに
>おいてはそれらと誤認してしまうという問題が発生しています。

正規表現は使えないのでしょうか? 使えるなら


		 "text/plain; x-type=rfc" => [
			      "^Network Working Group",
			      "^Request for Comments:",
			      "^Obsoletes:",
			      "^Category:",
			      "^Updates:",
				   ],
                 "text/rfc822" => [ "^Received:",   
                             "^>From",       
                             "^Return-Path:",
                             "^Cc:",         ],
                 "text/news" => [ "^Newsgroups:", 
                             "^Path:",       
                             "^Organization:" ],

のようにすればよいですよね。使えないなら対応した方がよいので
はないかと。:)

それから、FYIや internet-draft などは RFC と同じ形式なのでこ
れらも対応した方がよいでしょうね。


># ファイル名による判別も合わせて行ったほうが良いのかもしれません...

RFCなんかは特にそうですね。お願いします。

-- Satoru Takabayashi