小さなテーブルから重複行を削除する質問する

Question

より速い解決策は次のとおりです。

重複の最初の出現箇所を見つける。
次に、最初の重複発生以外のすべての行を削除します。

次のようになります。

DELETE FROM dups a USING (
    SELECT MIN(ctid) as ctid, key
    FROM dups 
    GROUP BY key HAVING COUNT(*) > 1
) b
WHERE a.key = b.key 
AND a.ctid <> b.ctid

このソリューションでは、どの行を保持するかを制御できないことに注意してください。

おもちゃの例

CREATE TABLE people (
    name    varchar(50) NOT NULL,
    surname varchar(50) NOT NULL,
    age     integer NOT NULL
);

INSERT INTO people (name, surname, age) VALUES 
    ('A.', 'Tom', 30),
    ('A.', 'Tom', 10),
    ('B.', 'Tom', 20),
    ('B', 'Chris', 20);

-- The inner command to find duplicates first occurences:
SELECT MIN(ctid) as ctid, name, surname
FROM people 
GROUP BY (name, surname) HAVING COUNT(*) > 1;


DELETE FROM people a USING (
    SELECT MIN(ctid) as ctid, name, surname
    FROM people 
    GROUP BY (name, surname) HAVING COUNT(*) > 1
) b
WHERE a.name = b.name
AND a.surname = b.surname
AND a.ctid <> b.ctid;

SELECT * FROM people;

内部リクエストの出力は次のようになります。

ctid	名前	姓
（０，１）	A.	トム

そして、最終的なリクエスト（削除後）の出力は次のようになります。

名前	姓	年
A.	トム	30
B.	トム	20
B	クリス	20

DB Fiddle でおもちゃの例を見る

Answer 1

より速い解決策は次のとおりです。

重複の最初の出現箇所を見つける。
次に、最初の重複発生以外のすべての行を削除します。

次のようになります。

DELETE FROM dups a USING (
    SELECT MIN(ctid) as ctid, key
    FROM dups 
    GROUP BY key HAVING COUNT(*) > 1
) b
WHERE a.key = b.key 
AND a.ctid <> b.ctid

このソリューションでは、どの行を保持するかを制御できないことに注意してください。

おもちゃの例

CREATE TABLE people (
    name    varchar(50) NOT NULL,
    surname varchar(50) NOT NULL,
    age     integer NOT NULL
);

INSERT INTO people (name, surname, age) VALUES 
    ('A.', 'Tom', 30),
    ('A.', 'Tom', 10),
    ('B.', 'Tom', 20),
    ('B', 'Chris', 20);

-- The inner command to find duplicates first occurences:
SELECT MIN(ctid) as ctid, name, surname
FROM people 
GROUP BY (name, surname) HAVING COUNT(*) > 1;


DELETE FROM people a USING (
    SELECT MIN(ctid) as ctid, name, surname
    FROM people 
    GROUP BY (name, surname) HAVING COUNT(*) > 1
) b
WHERE a.name = b.name
AND a.surname = b.surname
AND a.ctid <> b.ctid;

SELECT * FROM people;

内部リクエストの出力は次のようになります。

ctid	名前	姓
（０，１）	A.	トム

そして、最終的なリクエスト（削除後）の出力は次のようになります。

名前	姓	年
A.	トム	30
B.	トム	20
B	クリス	20

DB Fiddle でおもちゃの例を見る

小さなテーブルから重複行を削除する質問する

ベストアンサー1

おもちゃの例

おすすめ記事