namazu-ml(avocado)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: current problems of Namazu



高林です

Hajime BABA <baba@xxxxxxxxxxxxxxxxxxxxxx> wrote:

>・namazu.conf などで <BASE HREF="hoge"> を設定できるようにしたい。

これは doc-cd のために必ずやらないといけませんね。 Win32 用のバイ
ナリ配布も考えるとパスの情報などはリソース・ファイルで設定できない
と困りますし。

ところで、 Win32 については広瀬@NECエンジニアリングさんが詳しいで
す。 Win32 対応についての問題点などを洗い出して頂けるとありがたい
です (と、召喚してみる)。

私の把握している限りでは、cp の代わりに COPY を、 date は使わない、 
pwd を使わずに use Cwd して cwd() を使うようにすれば GNU Win32 が
なくてもインデクサが動くようになるということですが、他にも何かあっ
たら指摘してください。


>・dbname が namazu.cgi に渡せないので、doc-cd の時困った。
>  これも namazu.conf での設定かなあ。

これは hoge.html からいくつかのデータベース (foo, bar, baz) の中か
ら foo を選択して検索をかけると、その検索結果の表示から再び検索を
かけようとしたときにコケる、ということでしょうか。それなら foo の 
NMZ.head の <FORM> 〜 </FORM> の中に

<SELECT NAME="dbname">
<OPTION VALUE="foo">foo
<OPTION VALUE="bar">bar
<OPTION VALUE="baz">baz
</SELECT>

のように記述しておけば自動的に

<OPTION SELECTED VALUE="foo">foo

と SELECTED が付加されて継承されます。つまり foo, bar, baz の FORM 
の部分は共通で良いことになります。もしくは

<INPUT TYPE="HIDDEN" NAME="dbname" VALUE="foo">

と埋め込んでおけば強制的に foo を dbname にセットして回避できます。


>というエラーを吐く。ちゃんとしたエラーメッセージをHTMLでブラウザに
>返すようにしたほうが良いだろう。

これはあきらかな手抜きですね。直します。


>・(CD-ROMなど)INDEX_DIR が書き込み不許可な場合、これもerror_log に
>
>Error!
> NMZ.slog
>
>というエラーが出る。これは、
>  1) ロギングの有無をコンパイルオプションで設定できるようにする
>     (むろんデフォルトではON)

あ、今でもできますです。 -DSLOGOFF です。 Makefile の整備もしよう
と思います。質問ですが、対話型の configure スクリプトってあった方
が良いと思いますか? 実は、途中まで作ってほったらかしにしてあるので
すが、あった方が便利とのことならばパッケージに添付しようと思います。


>  2) NMZ.slog を置くディレクトリを namazu.conf などの
>     設定ファイルで設定できるようにする
>などがいいかな、と。

これもいいかもしれません。


>・Windows95 でコンパイルしようとすると ChaSen を要求されるので困っ
>  た。KAKASI のバイナリパッケージも作ったので、デフォルトで KAKASI 
>  になっているとうれしい。(^_^;)

Win32 の ChaSen は起動が遅い (Visual Basic らしい) ので、ディフォ
ルト KAKASI のほうがいいですね。バイナリ・パッケージはとても嬉しい
です (まだ試していませんが)。


>あと、すぐで無くても良いからそのうち修正したいこととして、
>
>・スコアリングを tf・idf 値にできないか?

うーん、私自身が正しく tf・idf 法を理解しているかアヤシイので誤解
しているかもしれませんが、 tf は単語の出現回数をそのまま使えばいい
んですよね。で、idf を求めるにはそのキーワードを含むファイルの数を
全文書数で割ってそれの対数をとると。

そういうことならインデックスはそのままで検索時に計算してあげればい
いわけですよね。それならなんとかなりそうです。ただその計算に少し時
間がかかってしまうかもしれません。コンパイル時に選べるようにしよう
と思います (または namazu.conf などで指定かな)。


>他にもあったような気がしますが忘れたのでまたそのうちに。

また何か気付いた点があればよろしくお願いします。

--
高林 哲 Satoru Takabayashi