フィールドの一致に基づいて2つのファイルの特定の列をマージします。

Question

これjoinユーティリティは、共通の列に基づいて2つのファイルの行をマージします。その列に基づいてファイルを並べ替える必要があります。

join -t $'\t' -1 10 -2 1 -o 2.1,2.2,1.7 <(sort -t $'\t' -k10 file1) <(sort -t $'\t' file2)

$'…'そして<(…)純粋なshでは動作しないkshまたはbashが必要です。

すでにソートされている場合はfile2これを使用でき、通常のshで動作します。

sort -t $'\t' -k10 file1 |
join -t "$(printf \\t)" -1 10 -2 1 -o 2.1,2.2,1.7 - file2

ファイルの1つの順序を維持したい場合でも使用できますが、最初に行join番号を追加して元の行番号を最後に並べ替えます。たとえば、次の順序を維持するには、次の手順を実行しますfile2。

join -t $'\t' -1 10 -2 1 -o 2.1,2.2,2.3,1.7 \
     <(sort -t $'\t' -k10 file1) \
     <(<file2 nl | sort -t $'\t' -k 2,2) |
sort | cut -d $'\t' -f 2-

Answer 1

これjoinユーティリティは、共通の列に基づいて2つのファイルの行をマージします。その列に基づいてファイルを並べ替える必要があります。

join -t $'\t' -1 10 -2 1 -o 2.1,2.2,1.7 <(sort -t $'\t' -k10 file1) <(sort -t $'\t' file2)

$'…'そして<(…)純粋なshでは動作しないkshまたはbashが必要です。

すでにソートされている場合はfile2これを使用でき、通常のshで動作します。

sort -t $'\t' -k10 file1 |
join -t "$(printf \\t)" -1 10 -2 1 -o 2.1,2.2,1.7 - file2

ファイルの1つの順序を維持したい場合でも使用できますが、最初に行join番号を追加して元の行番号を最後に並べ替えます。たとえば、次の順序を維持するには、次の手順を実行しますfile2。

join -t $'\t' -1 10 -2 1 -o 2.1,2.2,2.3,1.7 \
     <(sort -t $'\t' -k10 file1) \
     <(<file2 nl | sort -t $'\t' -k 2,2) |
sort | cut -d $'\t' -f 2-

おすすめ記事