SQL Server における INNER JOIN と LEFT JOIN のパフォーマンス質問する

Question

はLEFT JOINより絶対に速いわけではありませんINNER JOIN。実際、はより遅いのです。定義により、外部結合 (LEFT JOINまたはRIGHT JOIN) はのすべての作業にINNER JOIN加えて、結果を null 拡張する追加の作業を行う必要があります。また、より多くの行を返すことが予想され、結果セットのサイズが大きいため、合計実行時間がさらに長くなります。

（そして、想像しにくい要因の合流により、特定の状況でが高速にLEFT JOIN なったとしても、はと機能的に同等ではないため、単純にのすべてのインスタンスを他のに置き換えることはできません。）INNER JOIN

おそらく、候補キーや外部キーのインデックスが適切に作成されていないなど、パフォーマンスの問題は他の場所にあると考えられます。9 つのテーブルを結合するのはかなり多いため、速度低下は文字通りほぼどこでも発生する可能性があります。スキーマを投稿していただければ、より詳しい情報を提供できる可能性があります。

編集：

LEFT JOINこれをさらに考えてみると、がよりも速くなる可能性がある状況が 1 つ考えられますINNER JOIN。それは次の場合です。

一部のテーブルは非常に小さいです (たとえば、10 行未満)。
テーブルにはクエリをカバーするのに十分なインデックスがありません。

次の例を考えてみましょう。

CREATE TABLE #Test1
(
    ID int NOT NULL PRIMARY KEY,
    Name varchar(50) NOT NULL
)
INSERT #Test1 (ID, Name) VALUES (1, 'One')
INSERT #Test1 (ID, Name) VALUES (2, 'Two')
INSERT #Test1 (ID, Name) VALUES (3, 'Three')
INSERT #Test1 (ID, Name) VALUES (4, 'Four')
INSERT #Test1 (ID, Name) VALUES (5, 'Five')

CREATE TABLE #Test2
(
    ID int NOT NULL PRIMARY KEY,
    Name varchar(50) NOT NULL
)
INSERT #Test2 (ID, Name) VALUES (1, 'One')
INSERT #Test2 (ID, Name) VALUES (2, 'Two')
INSERT #Test2 (ID, Name) VALUES (3, 'Three')
INSERT #Test2 (ID, Name) VALUES (4, 'Four')
INSERT #Test2 (ID, Name) VALUES (5, 'Five')

SELECT *
FROM #Test1 t1
INNER JOIN #Test2 t2
ON t2.Name = t1.Name

SELECT *
FROM #Test1 t1
LEFT JOIN #Test2 t2
ON t2.Name = t1.Name

DROP TABLE #Test1
DROP TABLE #Test2

これを実行して実行プランを表示すると、クエリは上記の 2 つの条件を満たしているため、INNER JOIN確かによりもコストがかかることがわかります。これは、SQL Server がに対してハッシュマッチを実行しようとしますが、に対してはネストされたループを実行するためです。通常、前者の方がはるかに高速ですが、行数が非常に少なく、使用するインデックスがないため、ハッシュ操作がクエリの中で最もコストがかかる部分になります。LEFT JOININNER JOINLEFT JOIN

お気に入りのプログラミング言語で、5 つの要素を持つリストと 5 つの要素を持つハッシュテーブルで多数の検索を実行するプログラムを作成することで、同じ効果を確認できます。サイズのため、ハッシュテーブルバージョンは実際には遅くなります。ただし、50 要素、または 5000 要素に増やすと、リストバージョンは O(N) に対してハッシュテーブルは O(1) であるため、非常に遅くなります。

IDしかし、このクエリをではなく列に変更するNameと、まったく異なる状況になります。その場合、両方のクエリに対してネストされたループが実行されますが、このINNER JOINバージョンではクラスター化インデックススキャンの 1 つをシークに置き換えることができます。つまり、行数が多い場合、文字通り桁違いに高速になります。

したがって、結論は、私が数段落前に述べたこととほぼ同じです。これはほぼ間違いなくインデックスまたはインデックスカバレッジの問題であり、1 つ以上の非常に小さなテーブルと組み合わされている可能性があります。SQL Server がよりもに対して悪い実行プランを選択する可能性があるのは、このような状況だけです。INNER JOINLEFT JOIN

Answer 1