[Namazu-devel-ja 1490] Re: XPS 用フィルタ Re: Visio vdx 用フィルタ Re: visio2007.vdx ファイル問題

Yukio USUDA m6694ha392t @ asahi-net.or.jp
2007年 2月 10日 (土) 15:04:35 JST


臼田です

On 2007/02/08, at 2:07, Tadamasa Teranishi wrote:

>>
>>> ただし、各ページの XML ファイルの文字コードが
>>> UTF16-LE BOM 付きでした。
>
> 手元では、このパターンしか知りませんでしたが、
>
>> WindowsXP で Microsoft XPS Document Writer
>> を用いて XPS ファイルを作成してみました。
>>
>> 本文が入っているファイルが UTF-16 ではなく UTF-8
>> で記録されていました。
>
> というパターンもあるわけですね。
>
>> 文字コードを決めてかかってはいけないようなので

HEAD の filter/xps.pl のチェックをしていて
問題を見つけましたので
UTF16-LE は Encode で判別させずに
文書の先頭部で判断してから変換するようにしました。

また、HEAD の nmzcat を使う場合 pl/ 
codeconv.pl からの guess_encode
呼出し部分に問題があったので修正をしました。

臼田幸生






Namazu-devel-ja メーリングリストの案内