同じ2つのフィールドを持つ行を見つけ、それらの1つを除いてすべてを削除する方法[重複]

Question

GNUAWK

以下は、わずかに変更された入力ファイルを使用したテストの実行です。

bash-4.3$ $ awk '{v=sprintf("%s_%s",$1,$NF); if ( ! a[v]) print;   a[v]++;   }' input.txt 
bash: $: command not found
bash-4.3$ awk '{v=sprintf("%s_%s",$1,$NF); if ( ! a[v]) print;   a[v]++;   }' input.txt 
AAAAA stuff in between BBBBB
AA stuff AAABBBBB
AAAAA more stuff in the middle CCCCCC

bash-4.3$ cat input.txt
AAAAA stuff in between BBBBB
AA stuff AAABBBBB
AAAAA more stuff in the middle CCCCCC
AAAAA even more cool stuff BBBBB
AAAAA extra line CCCCCC

動作原理：

要点：キーと値のペアの配列を作成し、キーと値のペアの配列項目が既に存在するかどうかに基づいて印刷します。
キーは行の最後のフィールドv=sprintf("%s_%s",$1,$NF)で構成されます$NF。たとえば、行1と3の場合、キーはですAAAAABBBBB。値は一致するたびに増加する整数です。
v各行で変数とそのチェックを実行しif (!a[v]) print、配列に値が見つからない場合にのみ印刷します。
a[v]++印刷するかどうかに関係なく、すべての行で実行されます

Sundeepがコメントで指摘したように、同じアプローチを次のように単純化できます。

bash-4.3$ awk '!seen[$1"_"$NF]++' input.txt
AAAAA stuff in between BBBBB
AA stuff AAABBBBB
AAAAA more stuff in the middle CCCCCC

Answer 1

GNUAWK

以下は、わずかに変更された入力ファイルを使用したテストの実行です。

bash-4.3$ $ awk '{v=sprintf("%s_%s",$1,$NF); if ( ! a[v]) print;   a[v]++;   }' input.txt 
bash: $: command not found
bash-4.3$ awk '{v=sprintf("%s_%s",$1,$NF); if ( ! a[v]) print;   a[v]++;   }' input.txt 
AAAAA stuff in between BBBBB
AA stuff AAABBBBB
AAAAA more stuff in the middle CCCCCC

bash-4.3$ cat input.txt
AAAAA stuff in between BBBBB
AA stuff AAABBBBB
AAAAA more stuff in the middle CCCCCC
AAAAA even more cool stuff BBBBB
AAAAA extra line CCCCCC

動作原理：

要点：キーと値のペアの配列を作成し、キーと値のペアの配列項目が既に存在するかどうかに基づいて印刷します。
キーは行の最後のフィールドv=sprintf("%s_%s",$1,$NF)で構成されます$NF。たとえば、行1と3の場合、キーはですAAAAABBBBB。値は一致するたびに増加する整数です。
v各行で変数とそのチェックを実行しif (!a[v]) print、配列に値が見つからない場合にのみ印刷します。
a[v]++印刷するかどうかに関係なく、すべての行で実行されます

Sundeepがコメントで指摘したように、同じアプローチを次のように単純化できます。

bash-4.3$ awk '!seen[$1"_"$NF]++' input.txt
AAAAA stuff in between BBBBB
AA stuff AAABBBBB
AAAAA more stuff in the middle CCCCCC

同じ2つのフィールドを持つ行を見つけ、それらの1つを除いてすべてを削除する方法[重複]

ベストアンサー1

GNUAWK

動作原理：

おすすめ記事