namazu-ml(avocado)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: ps/pdf to text



<19980822012634T.ccsatoru@xxxxxxxxxxxxxxxxxx>の記事において
ccsatoru@xxxxxxxxxxxxxxxxxxさんは書きました。

広瀬です。

>> >久しぶりに fj.unix を見ていたらこんなんがあるそうです。
>> ><URL:http://www.research.digital.com/SRC/virtualpaper/pstotext.html>
>> ちょっと試してみたところ日本語は PostScript, PDFともにだめみたいで
>> す (英語の文書は OKでした)。
>> 上記のウェブペイジによると
>> >to pstotext. This information includes character metrics and
>> >encoding vectors, so in most situations we're able to reconstruct
>> >the plain text (converted to ISO Latin 1 encoding), with correct
>>                  ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
>> >word breaks and good guesses about line breaks. It even works for
>> >rotated text!
>> だそうなので、きっと日本語は扱えないのでしょう。
>> # 日本語の PostScript, PDF のエンコーディングってどうなっているの?

そうなのですか。。残念。 ;-)
#まだ自分で試してないのですが。。

そういえばいつの間にか mswordview が 0.2.1 になってる。。 ^^;

  Best regards,
--
Ken-ichi Hirose (^^)k!
e-mail: kenzo-@xxxxxxxxxx (or) EHC25612@xxxxxxxxxxx