Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: about pdf file



松永です。

  From: knok@xxxxxxxxxxxxx (NOKUBI Takatsugu)
  Subject: [namazu-users-ja] Re: about pdf file
  Date: Fri, 5 Jul 2002 17:47:08 JST
  Message-ID: <200207050902.SAA02894@xxxxxxxxxxxxxxxxxx>
/
> >> pdftotext -q -enc EUC-JP -raw hoge.pdf hoge.txt
> >> とすれば、hoge.txt は一応読めます。
> 
>   この問題は一応把握していて、CVS 上では対応がなされています。最新の
> filter/pdf.pl に入れかえるだけでも動作するはずです。
> http://www.namazu.org/ml/namazu-users-ja/msg02632.html

おお、そうでしたか。

> >> さて、これでよかったのでしょうか。それとも他に正しい方法があるのでしょ
> >> うか。
> 
>   Debian 的には pdf.pl を適当な名前に dpkg-divert した上で CVS 上の最
> 新の pdf.pl を置くのが作法に則った方法だと思います。次のバージョンでは
> 直るはずなので、upgrade する前には divert を元に戻す必要がある点に気を
> つけて下さい。

わかりました。debian だけのことかも知れないので、debian-users で聞こう
かとも思ったのですが、ついでですので、お聞きします。

PowerPoint 用のフィルタですが、pptHtml を使うことになっていますが、
パッケージとしては ppthtml が存在していました。そこで、symlink を張っ
てみたところ動いているようです。 

Excel 用のフィルタも xltHtml を使うことになっていますが、パッケージと
しては xlthtml があったので、symlink を張って使っています。

PostScript 用のフィルタには ps2text を使うことになっています。
Debian パッケージには見当たりませんでした。pstotext というパッケージが
あったので、入れてみて、symlink を張ってみましたが、これは動きませんで
した。

TeX ファイルには detex が必要ということでしたが、パッケージが見当たり
ませんでした。Google で検索した detex を /usr/local/bin に入れてみたと
ころ、動いているようです。

dvi ファイルは処理出来ました。しかし、platex で tarticle を使って作っ
た dvi ファイルは処理出来ませんでした。これは仕方がないんでしょうね。

info ファイルなんですが、text/x-info は未対応ということで、処理されな
いときと、text/plain として処理されるときがあります。
どうして、このような差が生じるのでしょうか。それと、info がまだ対応さ
れないのは何か技術的な困難があるのでしょうか。単に手が回らないだけなの
でしょうか。

texinfo ファイルの処理は出来ないんですよね?

検索プログラムについて。

debian/woody の現在の状態では、

/etc/emacs/site-start.d には namazu の記述が無いけれども w3m-namazu の
記述はある。そして、w3m-namazu は namazu.el が既に記述されているかどう
かを判断している。

というのは正しいですね?ということで、w3m-namazu を使う時は陽に
インデックスを設定する必要があるわけですね。

ドキュメントを見るとインデックスの指定は

(setq w3m-namazu-index-alist
       '(("document" "/Namazu/doc" "/Namazu/man" "/Namazu/info")
	 ("doc" "/Namazu/doc")
	 ("man" "/Namazu/man")
	 ("info" "/Namazu/info")
	 ("http" "/Namazu/http")))

(setq w3m-namazu-default-index "document")

でよさそうに見えるのですが、この設定で M-x w3-namazu を呼ぶと

Search failed: "<head>"

というメッセージが出てとまってしまいます。

C-u M-x w3m-namazu で doc man info などを個別に指定すれば、検索出来ま
す。しかし、ここで、複数の index を指定することが出来ません。

C-u M-x namazu だと、インデックスを複数指定出来るんですけどね。

# うーん、検索部分については w3m-el ML の方がよかったかな。