データフレームを結合（マージ）する方法（内部、外部、左、右）質問する

Question

merge関数とオプションのパラメータを使用すると、次のようになります。

Inner join: は、 merge(df1, df2) R が共通の変数名でフレームを自動的に結合するため、これらの例では機能しますが、必要なフィールドのみで一致していることを確認するために、を指定する必要があるでしょうおよびmerge(df1, df2, by = "CustomerId")を使用することもできます。by.xby.y

外部結合: merge(x = df1, y = df2, by = "CustomerId", all = TRUE)

左外側: merge(x = df1, y = df2, by = "CustomerId", all.x = TRUE)

右外側: merge(x = df1, y = df2, by = "CustomerId", all.y = TRUE)

クロス結合: merge(x = df1, y = df2, by = NULL)

~~内部結合の場合と同様に、一致する変数として「CustomerId」を R に明示的に渡す必要があるでしょう。~~ ほとんどの場合、マージする識別子を明示的に指定するのが最善だと思います。入力データフレームが予期せず変更された場合に安全であり、後で読みやすくなります。

byベクトルを指定すると、複数の列を結合できますby = c("CustomerId", "OrderId")。例:

結合する列名が同じでない場合は、たとえば、が最初のデータフレームの列名で、が 2 番目のデータフレームの列名であるby.x = "CustomerId_in_df1", by.y = "CustomerId_in_df2"ように指定できます。(複数の列を結合する必要がある場合は、これらをベクトルにすることもできます。)CustomerId_in_df1CustomerId_in_df2

Answer 1