私が使用しているファイルの小さな部分があります。
ENSDARG00000032737 ENSDARP00000120731
ENSDARG00000032737 ENSDARP00000049290
ENSDARG00000061051 ENSDARP00000081062
ENSDARG00000061051
ENSDARG00000061051 ENSDARP00000129708
最初の列に各固有値の最初のインスタンスを印刷し、2番目の列にその値を印刷したいので、希望の出力は次のようになります。
ENSDARG00000032737 ENSDARP00000120731
ENSDARG00000061051 ENSDARP00000081062
awkやuniqなどを使ってこれを行う簡単な方法はありますか?
どんな助けでも大変感謝します。
ベストアンサー1
POSIXAWK:
m1[$1] == 0 {
m1[$1] = 1
print
}
各行に対して、次の操作を行います。
- 「データベース」に最初の列があることを確認してください。
- それ以外の場合は、「データベース」に追加し、行全体を印刷します。