Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: macbinary.pl



寺西です。

Yukio USUDA wrote:
> 
> macbinary.plについて
> 
> Tadamasa Teranishi wrote:
> > 展開後のファイルタイプを返す方が良いでしょう。
> > (そして、この返されたファイルタイプを最優先で次のファイルタイプを
> > 決定する。)
> > フィルタの仕様を変えるのなら、HEAD だけの対応ですね。
> という案がありました。
> 
> HEAD版のmknmzを見ていたところ
> Archive処理用にapplyfilter()にmimetypeに関する引数が追加
> されているのに気づいたので上記の案を試してみました。

おお。

> 多少強引ですがMS-Office系のファイルタイプも決定できます。
> これでよければcommitしようと思います。

ぱっと見た感じでは、$mmtype を filetype と creator を filetype 優先
で決定しているようですが、ここは常に filetype と creator のペアで
比較する方が良くないでしょうか?

> ちなみにテスト用のファイルのうちきちんとインデックスができ
> ないものが2つありますが、これは外部プログラムの制限による
> ものです。

はい。外部プログラムが対応していないデータもほり込んでいます。

> tests/data/ja-mac/word6.doc は
> word5形式のため現在のmsword.plでは無視されます。
> これは、無視できていることが正常な動作です。

確かそうだった。

> tests/data/ja-mac/powerpoint4.ppt は
> powerpointのバージョンが古いためかppthtmlが処理できず

バージョンは古かったと思います。

> 'Created ppthtml'といったヘッダ文のみが出力されるため
> ppthtmlはエラーを出さないのですが意味のないインデックス
> が出来上がります。

だったかどうかはよく覚えていません。
# が、たぶんそうなのでしょう。

しばらくテスト環境がないので確認できませんが、おそらく予定された
動作だと思います。

> このためja-namazu-2でエラーになるという症状がでます。

ppthtml の問題なら powerpoint4.ppt を削除するということで
良いかもしれません。
または、powerpoint.pl でバージョンチェックして弾くかですね。
(こっちの方が良いか。)
doccat も対応していないようなら削除しても良いかもしれません。

これを応用すれば、gzip や compress, bzip2 にも使えるわけですね。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E