列に数字が連続して表示される回数に基づいて行を選択するには？

Question

解決策awk：

awk 'FNR==NR{c[$4]++;next;} c[$4]==3' file.dat file.dat

出力：

chr1    3000823 3000829 1  
chr1    3001003 3001009 1  
chr1    3001014 3001020 1  
chr1    3007426 3007432 10      
chr1    3007528 3007534 10  
chr1    3007576 3007582 10

説明する：

FNR==NR：このテストは、レコード数がファイル内のレコード数と等しい場合に真です。 2番目のファイルNRはfile1 + FNRの行数と同じであるため、これは最初のファイルでのみ機能します。
c[$4]++：配列要素のインデックスを増やします$4。カウンターとして使っています。
next: 他の操作を行わずに次のレコードに移動します。
c[$4]==3: これは、2 番目のファイルのレコードにのみ発生します。このテストが成功すると印刷が行われ、その行が印刷されますawk。

このコードの欠点は、ファイルを2回読み取ることです。しかし、私の考えでは、これが仕事を行うためのきちんと理解しやすい方法です。

Answer 1

解決策awk：

awk 'FNR==NR{c[$4]++;next;} c[$4]==3' file.dat file.dat

出力：

chr1    3000823 3000829 1  
chr1    3001003 3001009 1  
chr1    3001014 3001020 1  
chr1    3007426 3007432 10      
chr1    3007528 3007534 10  
chr1    3007576 3007582 10

説明する：

FNR==NR：このテストは、レコード数がファイル内のレコード数と等しい場合に真です。 2番目のファイルNRはfile1 + FNRの行数と同じであるため、これは最初のファイルでのみ機能します。
c[$4]++：配列要素のインデックスを増やします$4。カウンターとして使っています。
next: 他の操作を行わずに次のレコードに移動します。
c[$4]==3: これは、2 番目のファイルのレコードにのみ発生します。このテストが成功すると印刷が行われ、その行が印刷されますawk。

このコードの欠点は、ファイルを2回読み取ることです。しかし、私の考えでは、これが仕事を行うためのきちんと理解しやすい方法です。

列に数字が連続して表示される回数に基づいて行を選択するには？

ベストアンサー1

おすすめ記事