非常に大きなファイルから重複排除（）

Question

これは「0」列を空の列として扱いますが、より簡単なアイデアを提供します。

awk 'A[$c2] + B[$c3] + C[$c4]==0; 
    c2{A[$c2]++; next} c3{B[$c3]++;next} c4 {C[$c4]++}
' c2=2 c3=3 c4=4 input

(c2、c3、c4を関心のある実際の列番号に設定)

これをあなたのケースに拡張するには、次のものが利用可能である必要があります。

awk 'A[$c2] + B[$c3] + C[$c4]==0;
    match($c2,"[^ ]"){A[$c2]++; next}
    match($c3,"[^ ]"){B[$c3]++;next}
    match($c4,"[^ ]"){C[$c4]++}
' FS=\\t c2=2 c3=3 c4=4 input

Answer 1

これは「0」列を空の列として扱いますが、より簡単なアイデアを提供します。

awk 'A[$c2] + B[$c3] + C[$c4]==0; 
    c2{A[$c2]++; next} c3{B[$c3]++;next} c4 {C[$c4]++}
' c2=2 c3=3 c4=4 input

(c2、c3、c4を関心のある実際の列番号に設定)

これをあなたのケースに拡張するには、次のものが利用可能である必要があります。

awk 'A[$c2] + B[$c3] + C[$c4]==0;
    match($c2,"[^ ]"){A[$c2]++; next}
    match($c3,"[^ ]"){B[$c3]++;next}
    match($c4,"[^ ]"){C[$c4]++}
' FS=\\t c2=2 c3=3 c4=4 input

非常に大きなファイルから重複排除（）

ベストアンサー1

おすすめ記事