2つの条件(列基準と順序基準)に一致する項目を見つけます。

2つの条件(列基準と順序基準)に一致する項目を見つけます。

以下のようにタブ区切りのファイルがあります。最初の列は読み取り名で、3番目の列は読み取りが細菌か真核であるかを指定します。読み取りあたりの項目/照会回数が多い場合があります。その内容を抜粋したい最初 ヒット(行の最初の項目)は細菌です。

A00643:620:HFM7YDSX5:1:1101:9064:18223 LN590686.1 Eukaryota
A00643:620:HFM7YDSX5:1:1101:9064:18223 LN590686.1 Eukaryota
A00643:620:HFM7YDSX5:1:1101:9064:18223 LN590686.1 Eukaryota
A00643:620:HFM7YDSX5:1:1101:9064:18223 LN590686.1 Eukaryota
A00643:620:HFM7YDSX5:1:1101:9064:18223 LN590686.1 Eukaryota
A00643:620:HFM7YDSX5:1:1101:9064:18223 LN590686.1 Eukaryota
A00643:620:HFM7YDSX5:1:1101:9064:18223 LT700188.1 Bacteria
A00643:620:HFM7YDSX5:1:1101:9064:18223 LN598496.1 Eukaryota
A00643:620:HFM7YDSX5:1:1101:9064:18223 LN597789.1 Eukaryota
A00643:620:HFM7YDSX5:1:1101:9064:18223 LN596327.1 Eukaryota
A00643:620:HFM7YDSX5:1:1101:18258:19492 AL139347.10 Eukaryota
A00643:620:HFM7YDSX5:1:1101:31385:19554 LN600047.1 Eukaryota
A00643:620:HFM7YDSX5:1:1101:31385:19554 LN594833.1 Eukaryota
A00643:620:HFM7YDSX5:1:1101:31385:19554 LN590681.1 Eukaryota
A00643:620:HFM7YDSX5:1:1101:31385:19554 LN590681.1 Eukaryota
A00643:620:HFM7YDSX5:1:1101:31385:19554 LN590681.1 Eukaryota
A00643:620:HFM7YDSX5:1:1101:31385:19554 LN590681.1 Eukaryota
A00643:620:HFM7YDSX5:1:1101:31385:19554 LN590681.1 Eukaryota
A00643:620:HFM7YDSX5:1:1101:31385:19554 LN590681.1 Eukaryota
A00643:620:HFM7YDSX5:1:1101:31385:19554 LN590673.1 Eukaryota

Aさん本当にありがとうございます。

ベストアンサー1

私が正しく理解した場合:

awk -F '\t' '!seen[$1]++ && $3 == "Bacteria"' < your-file

最初のフィールドは以前に表示されず、3番目のフィールドはインラインを印刷しますBacteria

おすすめ記事