Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: 検索時の動作



<002c01c128c2$fd8060a0$3500a8c0@mein>の記事において
b-w@xxxxxxxxxxxxxさんは書きました。

>> 検索時の動作について教えて頂けませんでしょうか。
>> 仮にインデックスで書き出されるファイルのトータルが1GBあった場合に
>> 検索時にすべて(ログ、設定関連は除く)読込まれるのでしょうか?
>> それとも少ないディスクアクセスで検索出来るよのでしょうか?

  インデックスファイル全てを読むような動作はもちろんしません。でなけれ
ば高速な動作は見込めないと思います。

>> HDD選択の参考にしたいと思いますので
>> 宜しくお願いします。

  seek は割と発生すると思いますから、ランダムアクセスが高速な HDD を用
意できれば速度向上が見込めるかもしれません。

  試しに手元の環境(Linux)にて strace -c で system call が呼ばれる回数
を数えてみました。対象は RFC を index したもの(対象ファイル数 2300 強)
です。

# 何度か試しているうちに cache に hit するようになってしまったので、あ
# まりあてにならないデータかもしれません...

% time     seconds  usecs/call     calls    errors syscall
------ ----------- ----------- --------- --------- ----------------
 47.30    0.022277          42       533           read
 23.86    0.011235          27       423           _llseek
 10.53    0.004959          16       303        30 open
  6.81    0.003209          11       280           old_mmap
  5.37    0.002530          10       254           munmap
  2.88    0.001358           5       273           close
  2.26    0.001064           4       274           fstat
  0.49    0.000230           8        28           brk
  0.30    0.000140          13        11         8 stat
  0.08    0.000036           7         5           mprotect
  0.07    0.000035          12         3           write
  0.02    0.000009           9         1           uname
  0.01    0.000004           4         1         1 fstat64
  0.01    0.000003           3         1           time
  0.01    0.000003           3         1         1 ioctl
  0.01    0.000003           3         1         1 stat64
------ ----------- ----------- --------- --------- ----------------
100.00    0.047095                  2392        41 total
-- 
野首 貴嗣
E-mail: knok@xxxxxxxxxxxxx
	knok@xxxxxxxxxx / knok@xxxxxxxxxx