2006年9月20日

[Namazu-devel-ja 1228] Re: 検索精度の問題

At Wed, 20 Sep 2006 13:52:43 +0900,
Tadamasa Teranishi wrote:
> そうすると、ヒット数が多い場合に速度が落ちるということですね。
> であれば、インデックスを分割したことで速度が落ちたということではない
> かもしれませんね。(インデックス単位で MaxHit のチェックが行われる
> ので、インデックスを分割するということは MaxHit を増やすことと等価
> なため *1)

はい、その可能性は高いと思います。

> ちなみに、削除文書はそのインデックスに随分含まれていたのでしょうか?
> それとも、ほとんど削除文書は含まれていなかったのでしょうか?

これはまったく含まれていませんでした。

あと、1000万ファイルという話をしましたが、サイズも結構大きくて全体で
30GBぐらいのHTML文章です。大規模インデックスの人柱としては結構いい感じ
だとは思います。

> 32bit 越えはともかく、インデックス形式の見直しは必要でしょうね。
> 検索速度よりも、インデックスの更新速度の遅さがより問題で、その遅さの
> 原因は現在のインデックス形式に(も)ありますから。

そうですね。とはいえ旧来のインデックスからの移行パスはなにかしら欲し
いところです。変換するか、インデックス層を抽象化して選べるようにするか...
--
野首 貴嗣
E-mail: knok@xxxxx
knok@xxxxx / knok@xxxxx

_______________________________________________
Namazu-devel-ja mailing list
Namazu-devel-ja@xxxxx
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-devel-ja

投稿者 xml-rpc : 2006年9月20日 14:35
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/46221
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。