[Namazu-devel-ja 1434] Re: Office 2007, Visio 2007 対応

Tadamasa Teranishi yw3t-trns @ asahi-net.or.jp
2007年 1月 16日 (火) 12:56:16 JST


寺西です。

Yukio USUDA wrote:
> 
> 固定文字列でない計算結果やセルの書式上のものは
> 自力で数式をパースして作成しなければいけないのかもしれません。

やはりそうですか。

> 今回のサンプルにある
> 「2007年1月15日」「\5,000」は
> xl/worksheets/sheet3.xml 内に
> <row r="3" spans="1:3"><c r="B3" s="1"><v>39097</v></c><c r="C3"
> s="2"><v>5000</v></c></row>
> として入っていました。そのままとりだした場合
> 5000 は意味がありますが、 39097 は 2007年1月
> 15日の代用にはならないと思います。

この辺りは、doccat はきちんと変換できますが、xlhtml や xdoc2txt 
でもボロボロなところです。

今すぐどうこうということではないのですが、将来的にはきちんと
取り出せるのが良いでしょうね。
 
> >> また、積極的にサポートするつもりはないのですが
> >> ・OLE コンテナで Word に Excel の表を張り付け
> >> た場合に
> >>    Excel の表内の文書が取得できるか
> >> という点も気になっています。
> >
> > こちらは取り出せないようです。
...
> ちなみに win32/ole*.pl では取り出せるのでしょうか?
> できるようでしたら msofficexml.pl でも処理を追加してみるつ
> もりです。

win32/ole*.pl での動作確認はまだできていません。
もしかすると無理かもしれませんが、将来的には msofficexml.pl で
複合ファイルの対応もしたいものですね。

# 今までよりも、より情報が取り出せるとしたら、
# 独自フォーマットから OpenXML 化したことによるメリットと
# 考えられますし。

> msofficexml.pl の方法であればマクロも関係ないのですが
> win32/ole*.pl の方式だと気になりますね。

マクロの内容にもよるのですが、マクロによってセルの中身を計算して
いるのなら、マクロを実行した結果でないと意味がないと考えられなくも
ないわけでして、なかなか難しい問題を含んでいます。

また、マクロで処理する部分以外の固定的な文字列だけ取り出せれば良い
という考え方もあるでしょうから、まるっきり対応しないというのも
いけないのでしょうね。

線引きをどこにするのか、というのはなかなか難しいです。

> 今回は MS-Office2007 発売前だし
> 先に Namazu 2.0.17 をリリースするのであれば
> 現状で十分だろうと思っています。

はい。Office 2007 対応はまだ実験的ということで、十分だと思います。

> ただ、フォーマットはXMLで仕様書も
> 公開されていることですし対応できるものは対応していこうと思います。

ええ。これは今後の課題ということで。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns @ asahi-net.or.jp
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E




Namazu-devel-ja メーリングリストの案内