Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: 独自フィルタでの問題



橋本です。

少し調べてみると、以下のようなエラーが出るようになりました。

-----
[webadmin@mamo contrib]$ mknmz --output-dir="/var/namazu/index/swatch-ml" /var/s
pool/ml/watch-ml/htdocs/20010630
3個のファイルがインデックス作成の対象として見つかりました
1/3 - /var/spool/ml/watch-ml/htdocs/20010630/3.html [text/html]
/usr/share/kakasi/kanwadict: そのようなファイルやディレクトリはありません
2/3 - /var/spool/ml/watch-ml/htdocs/20010630/index.html [text/html]
/usr/share/kakasi/kanwadict: そのようなファイルやディレクトリはありません
3/3 - /var/spool/ml/watch-ml/htdocs/20010630/thread.html [text/html]
/usr/share/kakasi/kanwadict: そのようなファイルやディレクトリはありません
[基本]
日付:                Sun Jul  1 17:58:19 2001
追加された文書の数:  3
サイズ (bytes):      3,080
合計の文書数:        3
わかち書き:          /usr/bin/kakasi -ieuc -oeuc -w
経過時間 (秒):       4
ファイル/秒:         0.75
システム:            linux
Perl:                5.006
Namazu:              2.0.4
-----
どうも、kakasiのバイナリ辞書ファイルがないといっているようです。

kakasiの辞書ファイルを作成しないとだめなのでしょうか?

ちなみに、別途kakasiのインストールはしておらず、namazu-2.0.4.rpmを入れた
時に一緒に入ったようです。(RedHat7.0.1J)

さらに、kakasidictファイル(テキスト)も存在していません。


On Sun, 01 Jul 2001 17:35:41 +0900
mamoru hashimoto <mamo@xxxxxxxxxxxxxxxxxx> wrote:

> 橋本です。
> 
> -----
> sub mediatype() {
> 	return ('text/html; x-type=fmlhtml');
> }
> -----
> 
> のようになっており、このfmlhtml.plフィルタは以前、同じバージョンの
> namazu-2.0.4で動いていました。
> 
> 違いがあるとすれば、perlのバージョンが、5.0003→5.6.0になったくらいなの
> で、単なる設定ミスのような気がします。
> 
> ただ、気になるのは、
> 
> 1、filterとしての登録は、/usr/share/namazu/filterへのコピーだけでよいの
> か?(namazuインストールの仕方にもよりますが・・・)
> 
> 2、filterタイプの指定は、mknmzrcには、必要ないのか?
> 
> 以下、実際に動かしたshellスクリプトです。参考になるでしょうか?
> 
> -----
> #!/bin/sh
> #
> NMZ=/usr/bin/mknmz
> OUT=/var/namazu/index
> INP=/var/spool/ml
> CFG=/var/webadmin/NOC/contrib/.mknmzrc
> 
> ##############################
> ### Create Watch index
> ##############################
> for dir in $INP/watch-ml/htdocs/*
> do
>         if [ -d $dir ] ; then
>                 echo $dir
>                 $NMZ --no-delete --media-type='text/html; x-type=fmlhtml' \
>                 --output-dir="$OUT/watch-ml" --config="$CFG" $dir
>         fi
> done
> -----
> 
> On Sun, 01 Jul 2001 17:19:18 +0900
> HIROSE Yoshihide <yoshihide@xxxxxxxxxx> wrote:
> 
> > 廣瀬と申します。
> > 
> > At Sun, 01 Jul 2001 13:37:00 +0900,
> > mamoru hashimoto wrote:
> > 
> > > 独自のフィルタを作成して、fmlhtml.plでfml→html化したものをインデックス
> > > 化するというものです。
> > > 
> > > 未対応の形式と出力されているので、フィルタが認識されていないのかと思うの
> > > ですが、mknmz -Cではちゃんと出力されているようです。
> > 
> > こういうときは、実際に作成されたフィルタを見せてもらうのが
> > 手っ取り早いのですが。
> > 
> > > 1/1 - /var/spool/ml/watch-ml/htdocs/20010630/3.html 未対応の形式 (=text/html; x-type=fmlhtml)無視します
> > 
> > ここの(=text/html; x-type=fmlhtml)が怪しい気がします。
> > 作成されたフィルタではmediatype()を正しく返していますか?
> > 
> > で、ぼくもfmlのhtmlをちょっと見てみたのですが、単純にindex,thread等をインデクス対象から
> > はずすだけで良さそうなので、自作するなら filter/mhonarc.plを修正するのが簡単で良いと思います。
> > 
> > # ためしにやってみましたが、それなりに動くようです。
> > 
> > sd3 47% mknmz --media-type='text/html; x-type=fmlhtml' ../htdocs/
> > 検索対象のファイルを調べています...
> > 78個のファイルがインデックス作成の対象として見つかりました
> > 1/78 - /usr/people/hirose/fml/index/../htdocs/1000/1092.html [text/html; x-type=fmlhtml]
> > [snip]
> > 72/76 - /usr/people/hirose/fml/index/../htdocs/1100/1163.html [text/html; x-type=fmlhtml]
> > 73/76 - /usr/people/hirose/fml/index/../htdocs/1100/index.html is FML's index file! skipped.
> > 73/75 - /usr/people/hirose/fml/index/../htdocs/1100/thread.html is FML's index file! skipped.
> > 73/74 - /usr/people/hirose/fml/index/../htdocs/index.html is FML's index file! skipped.
> > 73/73 - /usr/people/hirose/fml/index/../htdocs/thread.html is FML's index file! skipped.
> > インデックスを書き出しています...
> > [基本]
> > 日付:                Sun Jul  1 17:11:34 2001
> > 追加された文書の数:  72
> > サイズ (bytes):      201,909
> > 合計の文書数:        72
> > 追加キーワード数:    5,030
> > 合計キーワード数:    5,030
> > わかち書き:          module_kakasi -ieuc -oeuc -w
> > 経過時間 (秒):       18
> > ファイル/秒:         4.00
> > システム:            irix
> > Perl:                5.00503
> > Namazu:              2.0.5
> 
>