MySQL vs MongoDB 1000 読み取り質問する

Question

MongoDB は魔法のように高速ではありません。基本的に同じ方法で整理された同じデータを保存し、まったく同じ方法でアクセスする場合、結果が大きく異なることは期待できません。結局のところ、MySQL と MongoDB はどちらも GPL なので、Mongo に魔法のように優れた IO コードが含まれていれば、MySQL チームはそれをコードベースに組み込むだけで済みます。

MongoDB では、ワークロードに適した異なる方法でクエリを実行できるため、実際の MongoDB のパフォーマンスを実感できます。

たとえば、複雑なエンティティに関する大量の情報を正規化された形式で保存する設計を考えてみましょう。この場合、MySQL (または任意のリレーショナルデータベース) の数十のテーブルを使用してデータを正規形式で保存することになり、テーブル間のリレーショナル整合性を確保するために多数のインデックスが必要になります。

次に、ドキュメントストアを使用した同じ設計について考えてみましょう。関連するテーブルがすべてメインテーブルに従属している場合 (多くの場合そうなります)、エンティティ全体を 1 つのドキュメントに格納するようにデータをモデル化できる可能性があります。MongoDB では、これを 1 つのドキュメントとして、1 つのコレクションに格納できます。ここから MongoDB は優れたパフォーマンスを実現します。

MongoDB では、エンティティ全体を取得するには、以下を実行する必要があります。

コレクション上の 1 つのインデックス検索 (エンティティが ID によって取得されると仮定)
1 つのデータベースページ (実際のバイナリ JSON ドキュメント) の内容を取得します。

つまり、B ツリー検索とバイナリページの読み取りです。Log(n) + 1 IO。インデックス全体をメモリ内に配置できる場合は、1 IO です。

20 個のテーブルを持つ MySQL では、次の操作を実行する必要があります。

ルートテーブル上の 1 つのインデックス検索 (ここでも、エンティティは ID によって取得されると仮定)
クラスター化インデックスでは、ルート行の値がインデックス内にあると想定できます。
エンティティの pk 値に対する 20 以上の範囲検索 (できればインデックス上)
これらはおそらくクラスター化インデックスではないため、適切な子行が判明したら、同じ 20 回以上のデータ検索が行われます。

したがって、すべてのインデックスがメモリ内にあると仮定しても (インデックスの数が 20 倍多いため、これは困難です)、mysql の合計は約 20 回の範囲検索になります。

これらの範囲検索はランダム IO で構成される可能性が高く、異なるテーブルはディスク上の異なる場所に確実に存在し、エンティティの同じテーブル内の同じ範囲内の異なる行が連続していない可能性があります (エンティティの更新方法などによって異なります)。

したがって、この例では、最終的な合計は、MongoDB と比較して、MySQL の論理アクセスあたりの IO が約20 倍になります。

これは、MongoDB がいくつかのユースケースでパフォーマンスを向上させる方法です。

Answer 1