Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Windows以外でRTF文書の文書フィルタの指定方法は?



吉野と申します。

ずいぶん前のお話になりますが、RTFに関する文書フィルタのお話が
あったと思います。
結論として Windows 以外では RTF文書フィルタが存在しないという
ところで終わっていましたし、実際に

http://www.namazu.org/doc/manual.html#doc-filter

では現在も RTF文書フィルタは Windows 専用になっています。

ただ、DocCat の最新バージョン(Ver3)は RTF を標準サポートして
います。こちらの動作環境は Solaris2.6 ですが、mknmz で

Unsupported media type (application/rtf) skipped.

が表示された文書を、DocCat でテキスト抽出したところ、正常に
テキスト展開ができました。

もちろん全てのパターンを検証できたわけではないのですが、
今のところ問題がないようです。

今使用しているのは namazu-2.0.10 ですが、Windows 以外でRTF文書の
文書フィルタを指定できないため、困っているというよりもったいない
気がします。

msword.pl と同じような位置付けで、olertf.pl の代替品に DocCat を
RTF文書の文書フィルタに指定することはできないでしょうか。

ご存知の方がいらっしゃいましたらご教授ください。
よろしくお願いいたします。

# mknmz -C
System: solaris
Namazu: 2.0.10
Perl: 5.006
NKF: module_nkf
KAKASI: module_kakasi -ieuc -oeuc -w
ChaSen: no
Wakati: module_kakasi -ieuc -oeuc -w
Lang_Msg: japanese
Lang: japanese
Coding System: euc
CONFDIR: /usr/local/etc/namazu
LIBDIR: /usr/local/share/namazu/pl
FILTERDIR: /usr/local/share/namazu/filter
TEMPLATEDIR: /usr/local/share/namazu/template
Supported media types:
  application/excel
  application/ichitaro6
  application/msword
  application/pdf
  application/powerpoint
  application/x-compress
  application/x-gzip
  application/x-js-taro
  message/news
  message/rfc822
  text/hnf
  text/html
  text/html; x-type=mhonarc
  text/plain
  text/plain; x-type=rfc
  text/x-hdml
  text/x-roff

******************************************
吉野 茂
******************************************