Namazu-win32-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: 以前は出なかったような?



 From: Takashi Harada <harada@xxxxxxxxx>
 Subject: [namazu-win32-users-ja] 以前は出なかったような?
 Date: Tue, 23 Jan 2001 18:04:26 +0900

 > olefiterを下記のものにして
 > oleexcel(v3.5)
 > olemsword(v2.14)
 > olepowerpoint(v2.14)

CVS (あるいは http://cvs.namazu.org/) から取得したものの場合は、ファ
イル先頭付近の $Id$ タグに表示されているバージョン(リビジョン)を書
いて頂けるとありがたいです。


 > os:win32(98se)でインデックス作成のテストを繰返してみていますが
 > ppt、pdf、xls、docで同名のファイルがあった場合に、ファイル種別は
 > 当然違いますがpptのファイルだけ、NMZ.result.normal.jaで表示される
 > タイトルが下記例の様に表示されます。

この ppt ファイルのプロパティで表示されるタイトル部分には半角カナ
が用いられていませんか。何も設定してないと、確か「スライドタイトル
なし(半角)」だったかな。ppt に限らず、doc, xls でも、タイトルある
いは著者部分で半角カナが用いられていたら、同じ問題を起こすかとおも
います。

ちとややこしいのですが、今の CVS ツリー上の最新の ole フィルタは、
getProperties() 内で BuiltInDocumentProperties('Title') などを使っ
てタイトルその他のプロパティを取得していますが、これは SJIS で記述
されているので、インデックス内部では内部コードの EUC に変換しない
といけません。ですが、olemsword.pl rev1.6, oleexcel.pl rev.1.8,
olepowerpoint.pl rev.1.6 までは変換するのを忘れてたので、たしかお
知らせ頂いたような現象になったとおもいます。それぞれ、1.7, 1.9,
1.7 では修正してます(1/19に直しました)。


ところで、ほんとうは、URI としては半角カナを含んでいるのはやむを得
ないけど、文書タイトル部などの表示部では半角カナはやっぱりなんとか
して排除したいところです。でも、実は codeconv::shiftjis_to_eucjp() 
一個しか関数がないのが問題で... 別に分ける方がいいのかも。




 > ファイルが日本語なのがいまいち(誰も英数名で作成してくれず ^^;)ですが、
 > インデックス作成時間等はppt等起動しなくなった所為で318文書(33MB)を
 > 5分で作成できます。ん〜、今までと違い、格段の速さです。

とりあえず、それはよかったです。しかし意外に速いですね... やっぱり
ハードウェアがいいと違いますね。:-)
--
馬場  肇 ( Hajime BABA )            E-mail: baba@xxxxxxxxxxxxxxxxxxxxxx
京都大学理学部宇宙物理学教室 博士後期課程
--