Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: macbinary.pl



Tadamasa Teranishi wrote:

> > 多少強引ですがMS-Office系のファイルタイプも決定できます。
> > これでよければcommitしようと思います。
> 
> ぱっと見た感じでは、$mmtype を filetype と creator を filetype 優先
> で決定しているようですが、ここは常に filetype と creator のペアで
> 比較する方が良くないでしょうか?
filetypeでチェックしてこぼれたものをcreatorでチェックして拾うと
いうことにしています。
filetypeとcreatorについては
FreeBSDやRedHatのmagicファイルを参考にさせていただいております。
その上で寺西さん提供のサンプルをバイナリエディタで眺めたところ
微妙に異なるもの、全く異なるものがありました。
filetypeとcreatorの文字列に関する網羅的なデータがないため厳しく
ANDで比較するとすり抜けるものがでそうです。

> はい。外部プログラムが対応していないデータもほり込んでいます。
> > tests/data/ja-mac/word6.doc は
> > word5形式のため現在のmsword.plでは無視されます。
> > これは、無視できていることが正常な動作です。
> 確かそうだった。
これのおかげで返り値にエラーが入って来たときの処理を入れる
ことができました。対応できないサンプルも重要ですね。

> ppthtml の問題なら powerpoint4.ppt を削除するということで
> 良いかもしれません。
Automakeは失敗することが予定されているテストというのは定義
できないのですかね?

> または、powerpoint.pl でバージョンチェックして弾くかですね。
> (こっちの方が良いか。)
> doccat も対応していないようなら削除しても良いかもしれません。
ppthtmlにそこまでの機能はなかったように思いますが。
ヘッダだけ出力して止めてしまうというのは正常動作ではないので
リターンコードが異なっているかもしれません。
少しソースを見るなりして試してみます。

> これを応用すれば、gzip や compress, bzip2 にも使えるわけですね。
他にもE-mailの添付ファイルやmhtファイルの展開に使えるのではと
思っています。

でも、このやり方だとuriは実体のファイルを指し示すため
Archive中の個別のファイルを指し示すuriにすることはできません。
Archive内のファイルについてはgnome-vfsのschemeのような表記で
uriを示す処理を考えているのではと思っていますので、野首さんの
ご意見をうかがって続きを考えようと思っております。

臼田幸生