ランダム化された3の中央値によるクイックソートは、ランダム化されたクイックソートよりもかなり優れていますか? 質問する

Question

定数のヒューリスティックな導出を以下に示します。さらに努力すれば、より厳密にできると思います。

Pを[0, 1]の範囲の値を持つ連続ランダム変数とします。直感的に、Pはピボットより小さい値の割合です。定数cを求めます。

cn lg n =え[n + c P n lg (P n) + c (1 - P) n lg ((1 - P) n)].

少し代数的に考えると、

c = 1/え[-P lg P - (1 - P) lg (1 - P))].

言い換えれば、c は平均 P のベルヌーイ分布の期待エントロピーの逆数です。直感的には、各要素について、約 lg n ビットの情報が得られるようにピボットと比較する必要があります。

Pが一様である場合、Pの確率密度関数は1である。定数は

In[1]:= -1/NIntegrate[x Log[2, x] + (1 - x) Log[2, 1 - x], {x, 0, 1}]

Out[1]= 1.38629

ピボットが中央値3のとき、Pのpdfは6 x (1 - x)です。定数は

In[2]:= -1/NIntegrate[6 x (1 - x) (x Log[2, x] + (1 - x) Log[2, 1 - x]), {x, 0, 1}]

Out[2]= 1.18825

Answer 1