列の重複項目を削除し、複数行の値を単一行に線形化します。

Question

簡単にアッ:

awk '{ r=$0; sub($1,"",r); a[$1]=(a[$1])? a[$1]"\t"r : r }
     END{ for(i in a) { gsub(/[[:space:]]{2,}/," ",a[i]); print i,a[i] } }' file

r=$0- 記録のコピーをキャプチャします。
sub($1,"",r)- コピーの最初のフィールドを削除して、残りのフィールドをr変数に保存します。
a[$1]=(a[$1])? a[$1]"\t"r : r- 同じ価値を築くグループ(セッション1で提案)
for(i in a)- グループ化されたすべての項目を繰り返します。
gsub(/[[:space:]]{2,}/," ",a[i])- 単語の間に不要なスペースを削除します。
print i,a[i]- グループ名と値の印刷

出力：

DAPPUDRAFT_194440  Phosphorous Temperature 
DAPPUDRAFT_196694  Salinity
DAPPUDRAFT_194512  Fishkairomones Cadmium Zinc Quantumdots
DAPPUDRAFT_194472  Phosphorous Fishkairomones Temperature 
DAPPUDRAFT_196131  Salinity Phosphorous hypoxia 
DAPPUDRAFT_195644  Salinity Phosphorous

Answer 1

簡単にアッ:

awk '{ r=$0; sub($1,"",r); a[$1]=(a[$1])? a[$1]"\t"r : r }
     END{ for(i in a) { gsub(/[[:space:]]{2,}/," ",a[i]); print i,a[i] } }' file

r=$0- 記録のコピーをキャプチャします。
sub($1,"",r)- コピーの最初のフィールドを削除して、残りのフィールドをr変数に保存します。
a[$1]=(a[$1])? a[$1]"\t"r : r- 同じ価値を築くグループ(セッション1で提案)
for(i in a)- グループ化されたすべての項目を繰り返します。
gsub(/[[:space:]]{2,}/," ",a[i])- 単語の間に不要なスペースを削除します。
print i,a[i]- グループ名と値の印刷

出力：

DAPPUDRAFT_194440  Phosphorous Temperature 
DAPPUDRAFT_196694  Salinity
DAPPUDRAFT_194512  Fishkairomones Cadmium Zinc Quantumdots
DAPPUDRAFT_194472  Phosphorous Fishkairomones Temperature 
DAPPUDRAFT_196131  Salinity Phosphorous hypoxia 
DAPPUDRAFT_195644  Salinity Phosphorous

列の重複項目を削除し、複数行の値を単一行に線形化します。

ベストアンサー1

おすすめ記事