[Namazu-win32-users-ja 928] Re: Windows ネイティブ版 Namazu 2.0.17RC5 動作チェック Office2003 での OLEコントロールフィルタ

Tadamasa Teranishi yw3t-trns @ asahi-net.or.jp
2007年 3月 6日 (火) 18:16:54 JST


寺西です。

Yukio USUDA wrote:
> 
> Tadamasa Teranishi wrote:
> >> 2.OLEコントロールフィルタは消費時間が長いようです。
> >>
> >
> > 何と比べてかは分かりませんが、そんなものじゃないでしょうか。
> > OLEフィルタって。
> >
> xdoc2txt.pl との比較ですが、きちんと計測はしていません。
> pltests の処理時間を見た感じだけです。
> MS-Office の一部を起動しているのでしょうからそういうものですね。

mknmz の実行の度(該当するOffice文書を処理する場合)に各Officeアプリ
ケーションを起動/終了するので、特に pltests では差が大きくなるで
しょうね。起動/終了のオーバーヘッドがかなりあるように思います。

ただ、通常使用の時は1回のmknmzの実行で良いので、起動/終了のオーバー
ヘッドは無視できるのではないかと思います。
ファイル単位の処理は、xdoc2txt.pl に比べて速いか遅いかは分かりません
が、極端な差はないのではないかと思います。
 
> >> 3.フィルタによって著者名の抽出場所が違うようです。
> >>  どちらがよいのかわかりませんが、下記の違いがあります。
...
> > で、この辺りをひっくるめてプロパティの取扱いを書き換えたいという
> > のが、そもそも話しをしていた事です。
> > また、扱いが実験的にというものにした理由でもあります。
> >
> > それらについては、次期バージョンまで持ち越します。
> >
> <dc:creator> タグ部分から著者名を切り出しているのを
> <cp:lastModifiedBy> タグ部分を優先として、
> <cp:lastModifiedBy> がない場合に <dc:creator> を使用することにすれば
> excel.pl や oleexcel.pl と合わせられますが、

そういったことをひっくるめて総合的にプロパティの処理を見直そうと
いうことです。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns @ asahi-net.or.jp
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E




Namazu-win32-users-ja メーリングリストの案内