namazu-ml(avocado)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: -F (filelist with drive letter)



Ken-ichi Hirose <hirose@xxxxxxxxxxxxxxxxxxxx> wrote:

>問題無ければ次の release にでも反映してください > 高林さん

次のリリースはどうしようかな…。半分冗談でつけた分散検索機能の扱い
をどうするか迷っています。

今のところ、ディフォールトではリモートのインデックスへのアクセスは
できなくて、明示的に $LIBDIR/urls.allow に記述して許可する方式になっ
ています。

また、逆にリモートから検索される側としては要求を拒否する仕組みはま
だありません。私としては CGIとして WWWに公開しているのなら分散検索 
(単に CGI の枠組みで実現しているだけですし) に協力してもらいたいと
ころですが、イヤだという人もいるでしょう。この点をディフォールトで
許可にするか不許可にするかで迷うところです。

一応補足しておくと分散検索なる機能は

  1. よそのホスト A の namazu.cgi に検索要求を出す
     出力として文書のID,スコア,タイムスタンプのリストをもらう
  
  2. 1 で得たデータを元にランキングし、検索結果の出力に必要
     な分の要約を A に求める
  
  3. 2 で得た要約を元に検索結果を出力する。プログラム終了。

1 と 2 のやりとりは HTTP でリモートの namazu.cgi に GET 要求を発行
して出力を返してもらっているだけです。リモートのホストでは 2度 
namazu.cgi が実行されます。検索要求が多段に複数のホストへ渡ること
はありません。単純な2往復のセッションで完結しています。

危険性といえばリモートに検索をかける側もかけられる側も DoS が考え
られますが、これは CGI の宿命と言えるので分散検索だからといって殊
更 DoS に弱いということもないでしょう。

私が考えているのはディフォールトで

  1. リモートのインデックスのアクセスは不可
     - 設定をすれば可能になる

  2. リモートからの検索要求は受け付ける
     - 設定をすれば不許可にできる

ぐらいのルールがよろしいかと思っています。ただし、 2 については慎
重に考えたほうが良いのかもしれません。判断つきかねます。

-- Satoru Takabayashi