2011年3月21日

[pgsql-jp: 40716]1:Nの結合に対して更に結合を行う場合の検索性能

武田と申します。結合のチューニングについて質問させて下さい。

例えば以下のようなSQLがあったとします。

select * from t1
natural join t2
natural join t3
where

t1pkey = [pkey]

以下のような条件を想定します。

・t1に対するwhere t1pkey = [pkey]の結果は常に1件
・t1→t2の対応関係は1:N。
・t2→t3の対応関係は1:1。
・t1→t3と直接結合するのは不可。必ずt2を経由する必要がある。
・【※】Nの値は不定だが極めて少ないことは予め分かっている。

例えば「ID○○番のマイミクのニックネームと画像URLが欲しい」
みたいな処理です。
(t1…ユーザーマスタ / t2…フレンドのリレーション / t3…プロフィール)

Nの値が極めて少ない、つまりt1 join t2の行数が極めて少ないのだから
t2→t3もIndexScanとなって欲しい、というのがコーディングの意図です。
実際、データ件数が少ないうちはIndexScanとなります。

ところが、予想外と言うか予想通りというか、t1,t2の件数が増えると
あるタイミングで突然SeqScanに変わります。(突然ガクンと性能落ちます)
Nの値にアプリケーション側で制限をかけていても、変わるときは変わります。

対策として、

・effective_cache_sizeを増加させる

一旦はこれで解決します。ところが、更に件数が増えると
やはり再度SeqScanとなってしまうため、イタチごっこな気がします。

・サブクエリ

冒頭のSQLを例えば以下のように書き換えます。

select
*,
(select t3c1 from t3 where pkey = t2.pkey) as t3c1,
(select t3c2 from t3 where pkey = t2.pkey) as t3c2,
(select t3c3 from t3 where pkey = t2.pkey) as t3c3,

(select t3cn from t3 where pkey = t2.pkey) as t3cn
from t1
natural join t2
where
t1pkey = [pkey]

これであれば件数に関係なく全てIndexScanとなります、が、
可読性が落ちる上、t1 join t2の結果一行一行に対して
カラム数の文だけサブクエリが走るコストも気になります。


もし「アナライザがそう判断している、従ってそういうもの」であれば
諦めるまでなのですが、設定値のチューニングなどで回避できるのであれば
その方が望ましいのではないかと思いました。

ちなみに、そもそも発生条件が不明なので参考になるか解りませんが、
8.4.4/9.0.1/9.0.2にて上記現象が発生することを確認しています。
回避方法、又は発生条件をご存じの方いらっしゃいませんでしょうか。


投稿者 xml-rpc : 2011年3月21日 20:54
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/102701
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。