Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: dxf.pl 試作品 Re: 新生olevisio.plフィルタ作りました。



寺西です。

Yukio USUDA wrote:
> 
> 建築研究所提供のフィルタは外部のテキスト抽出プログラムを呼び出している
> タイプですね。
...
> mknmzでロードするPerlの部分だけ取り込んでもよいのかもしれませんが、
> どうするのがよいのですかね。

フィルタを自作すれば、問題ないでしょう。
あるいは、フィルタが GPL で提供されている(はずですよね?)のなら、
フィルタのみ取り込んでしまうというのも手かと思います。(doccat のように)

> ということで、dxf 関連の話題がでてきたので
> dxf フィルタの試作品を HDD の奥から発掘しました。
> (テキスト版の dxf ファイルにのみ対応ですが、外部プログラムは不要です)

ちょっと今は試せませんが、時間ができれば試したいと思います。

> DXF のフォーマットについてはバイナリ型も含め公開されているようです

DXF フォーマットはアプリケーションによっては方言というか、実装が
曖昧というか、いろいろ互換性に問題があったりするのですが、文字情報
を取り出すぐらいなら、問題ないかもしれません。
# 図形を扱うと死にますが...。

> 流し読みした範囲ではバイナリ型DXFフォーマットもそれほど複雑ではないようなので
> サンプルが十分にあればフィルタも書けると思います。

実際のところ、バイナリDXFの流通はさほど多くはないので、テキストだけ
でも十分だろうと思います。
# バイナリ DXF が読めないアプリケーションは多いし。

ちなみに DXF のファイルフォーマットを解説した日本語の本も売ってます
ので、こちらを読むだけでも文字列の抽出ぐらいはできるのではないか
と思います。

http://www.amazon.co.jp/exec/obidos/ASIN/427406509X/qid=1085402991/sr=1-1/ref=sr_1_0_1/249-5411297-2003544
http://www.amazon.co.jp/exec/obidos/ASIN/482221463X/qid=1085403052/sr=1-3/ref=sr_1_0_3/249-5411297-2003544

前者は持っていませんが、後者は良く使ってます。

> DWG フォーマットは非公開だったと思いますが、独自解析によりパースして
> GPL で公開しているプログラムがありました。
> http://www.flatmtn.com/cad/links-dwgsrcode.html
> こちらは難しそうです。

むむむ。こちらも時間がとれれば確認してみたいと思います。
 
> visio も OLE ストレージのファイルなので taro7_10.plをベースにして
> この文献を参考に作っていけばなんとかできるとは思うのですが
> 日本語版では文字コードがどうなっているのかとか、実際のファイルを見
> つつ調べる必要がありますね。

visio のサンプルデータぐらいなら作れますが...と言ってみたりして。

# こっそり HEAD には visio のデータを入れてあります。少々大きいのは、
# サンプルということで画像を貼り付けたり、グループ化したり、
# カスタムプロパティを設定したりしているからです。
 
> どなたか visio が好きな方に期待したいです。

あと、メタファイルを埋め込めるので、そちらも解析していただければ
なおうれしいですね。(libwmf 使えば何とかなるのかな?)
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E