[Namazu-devel-ja 112] Re: フィルタ動作確認用スクリプト

Tadamasa Teranishi yw3t-trns @ asahi-net.or.jp
2004年 9月 5日 (日) 07:42:57 JST


寺西です。

Yukio USUDA wrote:
> 
> フィルタの動作確認用にスクリプトを作成しました。

おもしろいですね。

totext, nmzgrep2 共、フィルタ処理が走るので、少々処理に時間がかかる
ことと、カレントディレクトリにテンポラリファイルを作成/削除する
ことが注意点になるかと思うので、そのことをきちんと理解して使って
もらう必要はありますが、とても有用なコマンドだと思います。

> Namazu の pl/ ディレクトリに document.pl を入れて使ってください。
> document.pl は mknmz から filter 関連のルーチンを取り出して作成した
> ものです。

将来的には mknmz もこの document.pl を呼び出すような形になるという
ことですね。

> totext がテキスト抽出用のスクリプトです。1行目の perl のパスを書き換えて
> フィルタ動作確認用に使ってみてください。使用法はファイルを指定するだけで
> 下記のような感じです。

なかなか便利そうなコマンドです。

Namazu とは別のちょっとした検索エンジンを作成し、
totext を外部コマンドとして利用すれば、Namazu 以外のインデクサを
作ることに利用できたりして、面白そうです。
(その別の検索エンジンは、Namazu が対応する文書タイプは黙っていても
即対応となるし。)

# 手軽に別の検索エンジンが作れますね。

昨今でしたら、XML 出力で結果が得られると、いろいろ面白いこと
に利用する方がでてくるかもしれないので、toxml とかも作ると
良いかもしれません。(あるいはオプション?)
などと、夢がひろがってきます。
# 別に XML 出力が必要だという意味ではありません。
 
> nmzgrep2 はインデックスの検索結果をもとに grep を行う nmzgrep を拡張したものです。
> 使い方は nmzgrep と同じで、テキストファイル以外も対象にできます。
> document.pl の利用例として添付しています。

こちらも有用なコマンドですね。

当然フィルタ処理が走るので、nmzgrep と置き換えというわけにはいかない
かと思いますが、別コマンドとするなら名前は別のものがよろしいかと
思います。
xxx2 はさすがにちょっとなので、commit する際には別名にしましょう。
# とはいいつつ、良い名前は浮かばないけど、nmzegrep とかかな。

ちょっと話がそれますが、(nmzgrep2 だけではなくて) 付属ツールの
多くは、やっぱり UNIX での動作が前提になっています。
Windows 環境ではそのままでは使えそうにないですし、この辺りも
少々整理したいですね。
(せめて必須の外部コマンドのチェックぐらいはしたい。)
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns @ asahi-net.or.jp
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E




Namazu-devel-ja メーリングリストの案内