特定の列に同じ値を持つタブ区切りファイルのすべての行にif条件を適用します。

Question

awk 'BEGIN { FS=OFS="\t"; d["High"]=1; d["Medium"]=2; d["Low"]=3 } { print d[$3], $0 }' file |
sort -t $'\t' -k3,3 -k1,1n | sort -t $'\t' -s -u -k3,3 | cut -f 2-

残念ながら、「High」、「Medium」、および「Low」という単語はこの順序でアルファベット順にソートされないため、列3の対応する単語の各行の前に整数1、2、3を追加します。awkスクリプト。この整数は元のコンテンツとタブで区切られており、病気の重症度を表します（1が最も高い）。

次に、その整数フィールドの病気と修正データを並べ替えて、レコードを病気ごとにグループ化し、重症度別に並べ替えることができます。

その後、病気だけをコアとしてsort「ユニークにランク付け」します（2番目）。これは重複した病気をすべて削除し、各病気について最も深刻な記録のみを保存します。同じキーを持つレコードの並べ替えを維持する安定したソートアルゴリズムを使用します-s。sort

最後cutに、以前に追加した整数を削除しますawk。

パイプは、コマンドを指定するために使用されるフィールド区切りbash文字を想定していますsort。使用されていない場合はbash、代わりに一重引用符リテラルタブを挿入してください$'\t'（おそらくを押してこれを実行できますCtrl+V Tab）。

Answer 1

awk 'BEGIN { FS=OFS="\t"; d["High"]=1; d["Medium"]=2; d["Low"]=3 } { print d[$3], $0 }' file |
sort -t $'\t' -k3,3 -k1,1n | sort -t $'\t' -s -u -k3,3 | cut -f 2-