小さいファイルと大きいファイルの間で一致する値と一致しない値をマージして印刷します。

Question

読みやすくするために、元の例の形式を再指定します。

join -a1 -e "NoMatch" \
 <(awk -F ' ' '{print $0}' file1.txt |tail -n +2|sort -k1,1) \
 <(cat file2 | sort -k1,1)

すべての問題はjoinfile2の処理とオプションに関連しています。

file2は、フィールド1（フィールド2でなければならない）に基づいてソートされます。
-t '<tab>'options がない場合、joinfile2 はタブで区切られます。
joinfile2フィールド2を結合するオプションがありません。
file2のフィールドが正しい場合でも、デフォルトのjoin出力はリンクされたフィールドを最初に印刷するため、オプションを指定する-o FORMAT必要がありますjoin。
file2 ヘッダーは削除されません。
問題は発生しませんが、処理は不要です。最初の行をスキップできるため、tailfile1には必要ありません。awk
-F ' 'オプションは必要ありませんawk。

これらの問題を修正すると、次の結果が得られます。

#!/bin/bash
head -1 file2
join -t '   ' -2 2 -a 1 -e NoMatch -o 2.1,2.2,2.3 \
 <(awk 'NR==1{next} {print $0}' file1.txt | sort) \
 <(tail -n +2 file2 | sort -k2)

これにより、タブで区切られた次の出力が生成されます。

value   ID1     ID2
1       a       aaaa1
1       a       aaaa2
1       b       bbbb1
1       b       bbbb2
1       b       bbbb3
NoMatch NoMatch NoMatch
1       d       aaaa4

Answer 1

読みやすくするために、元の例の形式を再指定します。

join -a1 -e "NoMatch" \
 <(awk -F ' ' '{print $0}' file1.txt |tail -n +2|sort -k1,1) \
 <(cat file2 | sort -k1,1)

すべての問題はjoinfile2の処理とオプションに関連しています。

file2は、フィールド1（フィールド2でなければならない）に基づいてソートされます。
-t '<tab>'options がない場合、joinfile2 はタブで区切られます。
joinfile2フィールド2を結合するオプションがありません。
file2のフィールドが正しい場合でも、デフォルトのjoin出力はリンクされたフィールドを最初に印刷するため、オプションを指定する-o FORMAT必要がありますjoin。
file2 ヘッダーは削除されません。
問題は発生しませんが、処理は不要です。最初の行をスキップできるため、tailfile1には必要ありません。awk
-F ' 'オプションは必要ありませんawk。

これらの問題を修正すると、次の結果が得られます。

#!/bin/bash
head -1 file2
join -t '   ' -2 2 -a 1 -e NoMatch -o 2.1,2.2,2.3 \
 <(awk 'NR==1{next} {print $0}' file1.txt | sort) \
 <(tail -n +2 file2 | sort -k2)

これにより、タブで区切られた次の出力が生成されます。

value   ID1     ID2
1       a       aaaa1
1       a       aaaa2
1       b       bbbb1
1       b       bbbb2
1       b       bbbb3
NoMatch NoMatch NoMatch
1       d       aaaa4

小さいファイルと大きいファイルの間で一致する値と一致しない値をマージして印刷します。

#

ベストアンサー1

おすすめ記事