[Namazu-users-ja 558] Re: 拡張子の無いExcelファイルがインデックス作成できない

Yukio USUDA m6694ha392t @ asahi-net.or.jp
2005年 11月 12日 (土) 20:33:23 JST


臼田です。

nakashima-k wrote:

> 添付ファイルを拡張子の無いファイル名で保存し、それに対してインデックス作
> 成をしたいのですが、Excelファイルだけが、mknmzに対して
> 「未対応の形式: unknown」
> となり、インデックスが作成できません。
> 
> しかし、WordファイルやPDFファイル、Textファイル等は拡張子が無くても
> filter処理されます。
> 
MS-Officeのファイルを何個かバイナリエディタ等で眺めてみるとわかりますが、
どのファイルも先頭部分が同様の形式で、WordとExcelを識別できるヘッダと
呼べるものがついていません。
MS-Officeのファイルであっても同じ場所に良く出てくるパターンがあるばあい
についてはFileMMagicに何種類か登録されているので判定が出来る場合がありま
すが、必ず判定できるわけではありません。
このためファイルの中身で判定しきれない場合は拡張子を用いてファイル形式
の判定を確定させています。

MS-Officeや一太郎などOLE-Storageを使用しているファイルは拡張子なしにして
しまうと判定が難しいと思います。

臼田幸生





Namazu-users-ja メーリングリストの案内