[Namazu-users-ja 23] Re: pnamazuを使用したgrep検索をpdfやoffice文書に対して行いたい

Dai NAKAMURA dnimail @ software.sanix.jp
2004年 7月 14日 (水) 16:04:56 JST


中村です。

色々とありがとうございます。

Tadamasa Teranishi wrote:

>doccat を使っているということなら
>以下のスクリプトを cron で走らせると変換できるのではないかと
>思います。
>
>#!/bin/sh
>cd /org
>find . -type f -iregex ".*\.\(pdf\|doc\|xls\)" -exec /path/conv.sh {} \;
>
>また、/path/conv.sh が必要ですが、この中身は
>
>#!/bin/sh
>
>OUTPUTDIR="/txt"
>
>input=$1
>output="${OUTPUTDIR}/$1"
>dir=`dirname ${output}`
>test -d ${dir} || mkdir -p ${dir}
>
>doccat $input > $output
>  
>
うう・・・shellはあまり得意でないのですが、この路線で考えてみます。
多分、ディレクトリやファイルの変名・移動があった際に移動元が残って
しまうような気もしています。(間違っていたらすみません)
定期的に掃除すればいいですかね。

どうも本当に色々ありがとうございます。





Namazu-users-ja メーリングリストの案内