pandasのmerge()とconcat()の違い質問する

Question

非常に高レベルの違いは、はmerge()共通列の値に基づいて 2 つ (またはそれ以上) のデータフレームを結合するために使用され (インデックスも使用できます。およびleft_index=True/またはを使用しますright_index=True)、は1 つ (またはそれ以上) のデータフレームを上下に (またはオプションが 0 または 1 に設定されているconcat()かどうかに応じて横に) 追加するために使用されていることです。axis

join()は、インデックスに基づいて 2 つのデータフレームを結合するために使用されます。merge()オプションを使用する代わりにleft_index=True、を使用できますjoin()。

例えば：

df1 = pd.DataFrame({'Key': ['b', 'b', 'a', 'c', 'a', 'a', 'b'], 'data1': range(7)})

df1:
   Key  data1
0   b   0
1   b   1
2   a   2
3   c   3
4   a   4
5   a   5
6   b   6

df2 = pd.DataFrame({'Key': ['a', 'b', 'd'], 'data2': range(3)})

df2:
    Key data2
0   a   0
1   b   1
2   d   2

#Merge
# The 2 dataframes are merged on the basis of values in column "Key" as it is 
# a common column in 2 dataframes

pd.merge(df1, df2)

   Key data1 data2
0   b    0    1
1   b    1    1
2   b    6    1
3   a    2    0
4   a    4    0
5   a    5    0

#Concat
# df2 dataframe is appended at the bottom of df1 

pd.concat([df1, df2])

   Key data1 data2
0   b   0     NaN
1   b   1     NaN
2   a   2     NaN
3   c   3     NaN
4   a   4     NaN
5   a   5     NaN
6   b   6     NaN
0   a   Nan   0
1   b   Nan   1
2   d   Nan   2

Answer 1

非常に高レベルの違いは、はmerge()共通列の値に基づいて 2 つ (またはそれ以上) のデータフレームを結合するために使用され (インデックスも使用できます。およびleft_index=True/またはを使用しますright_index=True)、は1 つ (またはそれ以上) のデータフレームを上下に (またはオプションが 0 または 1 に設定されているconcat()かどうかに応じて横に) 追加するために使用されていることです。axis

join()は、インデックスに基づいて 2 つのデータフレームを結合するために使用されます。merge()オプションを使用する代わりにleft_index=True、を使用できますjoin()。

例えば：

df1 = pd.DataFrame({'Key': ['b', 'b', 'a', 'c', 'a', 'a', 'b'], 'data1': range(7)})

df1:
   Key  data1
0   b   0
1   b   1
2   a   2
3   c   3
4   a   4
5   a   5
6   b   6

df2 = pd.DataFrame({'Key': ['a', 'b', 'd'], 'data2': range(3)})

df2:
    Key data2
0   a   0
1   b   1
2   d   2

#Merge
# The 2 dataframes are merged on the basis of values in column "Key" as it is 
# a common column in 2 dataframes

pd.merge(df1, df2)

   Key data1 data2
0   b    0    1
1   b    1    1
2   b    6    1
3   a    2    0
4   a    4    0
5   a    5    0

#Concat
# df2 dataframe is appended at the bottom of df1 

pd.concat([df1, df2])

   Key data1 data2
0   b   0     NaN
1   b   1     NaN
2   a   2     NaN
3   c   3     NaN
4   a   4     NaN
5   a   5     NaN
6   b   6     NaN
0   a   Nan   0
1   b   Nan   1
2   d   Nan   2

pandasのmerge()とconcat()の違い質問する

ベストアンサー1

おすすめ記事