Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

dxf.pl 試作品 Re: 新生olevisio.plフィルタ作りました。



臼田です

Tadamasa Teranishi wrote:
> 
> 本当は、.dxf, .dwg の検索に使えるフィルタを Namazu Project として
> 用意できないかなという意味なのですが、このコマンドを呼び出す
> フィルタを別に用意すればよいのかもしれません。
> (そのまま、取り込んでも良いのかもしれませんが、未確認なもので。)
> 
建築研究所提供のフィルタは外部のテキスト抽出プログラムを呼び出している
タイプですね。
テキスト抽出プログラムは独立したバイナリファイルで、再配布はできない
ようなことが書いてあったように思います。
mknmzでロードするPerlの部分だけ取り込んでもよいのかもしれませんが、
どうするのがよいのですかね。

ということで、dxf 関連の話題がでてきたので
dxf フィルタの試作品を HDD の奥から発掘しました。
(テキスト版の dxf ファイルにのみ対応ですが、外部プログラムは不要です)

バイナリ型の dxf ファイルについて情報収集していた際に建築研究所製の
フィルタがあるのを見つけてそれ以上作業するのをやめてしまいましたが
なにかの参考になるかもしれないので放流してみます。添付しています。

関心のある方のために、関連情報の uri も示しておきます。

DXF のフォーマットについてはバイナリ型も含め公開されているようです
http://usa.autodesk.com/adsk/servlet/item?id=752569&siteID=123112
流し読みした範囲ではバイナリ型DXFフォーマットもそれほど複雑ではないようなので
サンプルが十分にあればフィルタも書けると思います。
DXFだけならサンプルをいくつかもらえればもう少し手を加えて対応できるか
と思っています。


DWG フォーマットは非公開だったと思いますが、独自解析によりパースして
GPL で公開しているプログラムがありました。
http://www.flatmtn.com/cad/links-dwgsrcode.html
こちらは難しそうです。


> > また、visioのファイルフォーマットも一部解析がされているようです。
> > http://www.redferni.uklinux.net/visio/
> > ここの情報でもテキスト抽出だけなら十分かもしれないのでVisio利用でない
> > フィルタが作れるかもしれません。
> 
> みた限り難しそう。何方かがんばってみませんか?
> -- 
visio も OLE ストレージのファイルなので taro7_10.plをベースにして
この文献を参考に作っていけばなんとかできるとは思うのですが
日本語版では文字コードがどうなっているのかとか、実際のファイルを見
つつ調べる必要がありますね。

どなたか visio が好きな方に期待したいです。

臼田幸生

Attachment: ascii_dxf.pl
Description: Binary data