2006年9月21日

[Namazu-devel-ja 1231] Re: 検索精度の問題

寺西です。

よく見ると...。

Tadamasa Teranishi wrote:
>
> > 具体的には、1つにまとめたインデックスが0.1秒以内に検索が完了するとし
> > て、50程度に分割した場合は4-5秒ぐらいかかるようになりました。


1つにまとめたインデックスの時の検索速度は、Hit数が異なっているので、
単純に分割したインデックスと比較できませんから無視するとして。

50程度に分割した場合は、4〜5秒で検索できているというのなら、Namazu
なら妥当かもしれません。かなりの数が Hit しているわけですから。
この4〜5秒が遅いかといえば微妙です。待てない時間でもないでしょう。

Namazu 以外の検索システムだと、この規模でも4〜5秒もかかりはしないで
しょうけれども、Namazu は「中、小規模」向けなので...ってことですね。

この4〜5秒は、けっして速くはないのだけれど、

> そうすると、純粋にヒット数が多い場合に遅いということですね。
> O(n^2) という箇所はないと思うので、係数が大きいのかなぁ。
> 確かに先のコピーの件でも、nmz_data は24バイトですから、ポインタなら
> 1/6の速度で済むので n が非常に大きい時には効いてくるかもしれません。

とか、様々なところで遅い部分があるからでしょう。
プロファイラ使って遅い部分を、地道にチューニングして書き直すと速く
なるような気もします。
nmz_copy_hlist をマクロにするだけでも速くなりそうだし、関数の引数
をポインタ渡しにするだけでも速くなりそう。

いずれにしても、どこかで異常に遅い処理をしているといったことでは
なくて、積み重なって全体が重いということだと思います。

# デフォルトじゃ 50 もインデックス使えませんよね。書き換えたのかな?
--
=====================================================================
寺西 忠勝(TADAMASA TERANISHI) yw3t-trns@xxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E

_______________________________________________
Namazu-devel-ja mailing list
Namazu-devel-ja@xxxxx
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-devel-ja

投稿者 xml-rpc : 2006年9月21日 03:35
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/46424
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。