Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: macbinary.pl



寺西です。

Yukio USUDA wrote:
> 
> > ぱっと見た感じでは、$mmtype を filetype と creator を filetype 優先
> > で決定しているようですが、ここは常に filetype と creator のペアで
> > 比較する方が良くないでしょうか?

というのは誤認の元になるからです。

> filetypeでチェックしてこぼれたものをcreatorでチェックして拾うと
> いうことにしています。

RTF の filetype が TEXT だったりします。ですので、filetype だけ
で、text/plain とすると誤認します。(たぶん)

# data/ja-mac/textedit.rtf の filetype は空です。ごめんなさい。
# あまり良いサンプルでなくて。

> filetypeとcreatorについては
> FreeBSDやRedHatのmagicファイルを参考にさせていただいております。

他に参考にできる良いものがないのですが、
これらの magic ファイルの内容はあまりきちんとしたものになって
いません。
まぁ、UNIX 環境でとりあえず使える程度のものなんでしょうね。
残念ながら。

ちなみに UNIX extensions and Macintosh Creator/Type mapping database
が、 http://ext.comitas.no/?page=10&prpage=20  にあります。
# この内容も随分抜けがあったり、古かったりするのですが...。

> その上で寺西さん提供のサンプルをバイナリエディタで眺めたところ
> 微妙に異なるもの、全く異なるものがありました。

バージョンによって filetype が異なることはよくあります。

> filetypeとcreatorの文字列に関する網羅的なデータがないため厳しく
> ANDで比較するとすり抜けるものがでそうです。

この辺りは考え方の違いかもしれませんが、妙なものを誤認するのが
良いか、判定をすり抜けてしまうのが良いと考えるかなんでしょうね。

# で、どっちが良いとも言えないところが難しい。

もうちょっと実用的なサンプルデータを集めて、実用上問題のない
ところまで対応するというのが良いのでしょうね。

常に filetype と creator のペアで比較するというのも、creator 違いで
同じメディアタイプもあるだろうから、面倒といえば面倒ですしねぇ。
 
> > ppthtml の問題なら powerpoint4.ppt を削除するということで
> > 良いかもしれません。
> Automakeは失敗することが予定されているテストというのは定義
> できないのですかね?

詳しくないですが、可能だったのではないかと、思います。
# あんまり自信ないけど。

> > または、powerpoint.pl でバージョンチェックして弾くかですね。
> ppthtmlにそこまでの機能はなかったように思いますが。

ええ。

> ヘッダだけ出力して止めてしまうというのは正常動作ではないので
> リターンコードが異なっているかもしれません。
> 少しソースを見るなりして試してみます。

とか、本文が空だと思える場合ははじくとかですかね。でも。

> > doccat も対応していないようなら削除しても良いかもしれません。

対応してなさそう。

powerpoint4 って随分と古いので、これをはじくための処理をわざわざ
するまでもないような気はしてきました。
powerpoint4 が現存する確率は低いだろうし。

> > これを応用すれば、gzip や compress, bzip2 にも使えるわけですね。
> 他にもE-mailの添付ファイルやmhtファイルの展開に使えるのではと
> 思っています。

添付ファイルが複数だったりした場合でも対応可能そうなんですね。
それはすごい。

なら、lha とか tar とかアーカイブ系にも応用が効きそう。
って、元々それ用に追加された機能か。
 
> Archive内のファイルについてはgnome-vfsのschemeのような表記で
> uriを示す処理を考えているのではと思っていますので、野首さんの
> ご意見をうかがって続きを考えようと思っております。

へぇ。よければ、gnome-vfsのschemeってどんなものかわかる uri を
教えていただければうれしいです。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E