Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: File::Magicでの挙動



  菅です。

  Mac の pdf ではないのですが、時として *.doc もかなり 未対応の形式 になって
  しまいます。パスの途中で日本語のpath(%B5....) 等の場合だけかと思って
  いましたが、そうでもないようです。
#日本語パス名が入っていても出来て良いように思いますし。。

  あるファイルが 未対応 となったので、直接調べてみると、

% wvVersion  /XX/XXXXX/XXX/aa.doc
Version: word8 or higher, Encrypted: No

% wvhtml /XX/XXXXX/XXX/aa.doc aa.html
% nkf -e aa.html |more
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" "http://www.w3.or
g/TR/REC-html40/loose.dtd">
<html> 
<head> 
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=UTF-8">
<META NAME="GENERATOR" CONTENT="wvWare/wvWare version 0.7.6">
<title> 
:
:

  と、言う感じでちゃんと出来ていそうな気がするのですが判定では 未対応 と
  なるので、index 化されていないと思われます。先日の判定に使用した
  File スクリプトでの判断でも application/msword と、なります。

  このような場合の対処はどのように考えていけば良いでしょうか?
  Solaris の頃もあったのですがこちらはまだ仮運用だったのであまり気に
  していませんでした。

  File:Magic の問題かは分からないのですが、ファイルタイプの誤認?なので
  ここへ繋ぎました。
-- 

					ADVANTEST corp.
					Taiji.Can@xxxxxxxxxxxxxxxxxxx