Postgres の Btree インデックスと MySQL B+tree の使用について質問する

Question

まず第一に、使用していない場合翻訳この質問を閉じて、InnoDBで再構築してから、質問を再度開く必要があるかどうかを確認してください。MyISAMはない好ましいことであり、議論すべきではありません。

どのようにしていたインデックスを構築するMySQL では、明示的または暗黙的にインデックスを構築する方法はいくつかありますが、それによってパッキングの質が上がったり下がったりします。

MySQL: データとインデックスは、以下のB+ツリーに格納されます。16KBブロック。

MySQL:UNIQUEインデックス（を含むPRIMARY KEY）更新する必要がある行を挿入するときに、UNIQUEインデックスには必然的に多くのブロック分割などが含まれることになります。

MySQL:PRIMARY KEYクラスター化されているデータと一緒にロードされるため、実質的にスペースをまったく占有しません。データを PK 順にロードすると、ブロックの断片化は最小限に抑えられます。

非UNIQUEセカンダリキーはオンザフライで構築される可能性があり、これにより断片化が発生します。または、テーブルがロードされた後に構築される可能性があり、これにより、より高密度のパッキングが発生します。

セカンダリキー (UNIQUEまたはそうでないキー)PRIMARY KEYには暗黙的にが含まれます。PK が「大きい」場合、セカンダリキーは大きくなります。あなたの PK は何ですか? これが「答え」ですか?

理論上、BTreeに完全にランダムに挿入すると、ブロックは約69% 満杯おそらくこれが答えでしょう。MySQL は 45% 大きい (1/69%) のでしょうか?

1 億行の場合、必要なすべてのデータやインデックスブロックをキャッシュするのに十分な RAM がないため、多くの操作が I/O バウンドになる可能性があります。すべてがキャッシュされている場合、B ツリーと B+ ツリーの違いはあまりありません。完全にキャッシュされていない場合に範囲クエリで何が起こる必要があるかを分析してみましょう。

どちらのタイプのツリーでも、操作はツリーのドリルダウンから始まります。MySQL の場合、1 億行には約 4 レベルの深さの B+ ツリーがあります。3 つの非リーフノード (これも 16KB ブロック) はキャッシュされ (まだキャッシュされていない場合)、再利用されます。Postgres でも、このキャッシュはおそらく発生します (Postgres については知りません)。次に、範囲スキャンが開始されます。MySQL では、ブロックの残りを順に調べます (経験則: 1 つのブロックに 100 行)。Postgres でも同じでしょうか?

ブロックの最後では、何か別のことが起きる必要があります。MySQL の場合、次のブロックへのリンクがあります。そのブロック (100 行以上) は、ディスクから取得されます (キャッシュされていない場合)。B ツリーの場合、非リーフノードを再度トラバースする必要があります。2 レベル、おそらく 3 レベルがまだキャッシュされています。別の非リーフノードをディスクから取得する必要があるのは、1/10K 行だけです (10K = 100*100)。つまり、Postgres は、"コールド" システムであっても、MySQL よりも 1% 多くディスクにアクセスする可能性があります。

一方、行数が非常に多いため、16K ブロックに 1 行または 2 行しか収まらない場合は、私が使用していた「100」は「2」に近くなり、1% はおそらく 50% になります。つまり、大きな行がある場合、これが「答え」になるかもしれません。それは...ですか？

Postgres のブロックサイズはどれくらいですか?上記の計算の多くは、ブロックとデータの相対的なサイズに依存することに注意してください。これが答えでしょうか?

結論：4 つの可能な回答を示しました。これらのそれぞれが当てはまるかどうかを確認または反論するために、質問を補足しますか? (セカンダリインデックスの存在、大きな PK、セカンダリインデックスの非効率的な構築、大きな行、ブロックサイズなど)

PRIMARY KEYに関する補足

InnoDB の場合、注意すべきもう 1 つの点があります...PRIMARY KEYデータをロードする前に、テーブルの定義にを含めることをお勧めします。の前に、データを PK 順にソートすることもお勧めします。またはキーLOAD DATAを指定しないと、InnoDB は非表示の 6 バイト PK を構築します。これは通常、最適ではありません。PRIMARY KEYUNIQUE

Answer 1