特定の単語数が多い行を削除

Question

仮説鍵は4番目のフィールドで、同じキーを持つレコードが連続しています（あなたの質問を正しく理解しました）。次のようにできます。

perl -lane '
  $na = grep {$_ eq "NA"} @F;

  if ($F[3] eq $last_key) {
    if ($na < $min_na) {
      $min_na = $na; $min = $_
    }
  } else {
    print $min unless $. == 1;
    $last_key = $F[3]; $min = $_; $min_na = $na;
  }
  END{print $min if $.}' < your-file

同じ 4 番目のフィールドを持つ連続した行のうち、NAフィールド数が最も少ない最初の行を印刷します。

連続していない場合は、ソートを使用できます。

< yourfile awk '{for (i=n=0;i<NF;i++) if ($i == "NA") n++; print n, $0}' |
  sort -k5,5 -k1,1n |
  sort -muk5,5 |
  cut -d ' ' -f 2-

を使用するときは、2番目の呼び出しに対応するオプションを追加するbusybox sort必要があります。-s-m

Answer 1

仮説鍵は4番目のフィールドで、同じキーを持つレコードが連続しています（あなたの質問を正しく理解しました）。次のようにできます。

perl -lane '
  $na = grep {$_ eq "NA"} @F;

  if ($F[3] eq $last_key) {
    if ($na < $min_na) {
      $min_na = $na; $min = $_
    }
  } else {
    print $min unless $. == 1;
    $last_key = $F[3]; $min = $_; $min_na = $na;
  }
  END{print $min if $.}' < your-file

同じ 4 番目のフィールドを持つ連続した行のうち、NAフィールド数が最も少ない最初の行を印刷します。

連続していない場合は、ソートを使用できます。

< yourfile awk '{for (i=n=0;i<NF;i++) if ($i == "NA") n++; print n, $0}' |
  sort -k5,5 -k1,1n |
  sort -muk5,5 |
  cut -d ' ' -f 2-

を使用するときは、2番目の呼び出しに対応するオプションを追加するbusybox sort必要があります。-s-m

特定の単語数が多い行を削除

ベストアンサー1

おすすめ記事