このようなファイルには3つのゲノムがあります
col1 col2 col3
CXCL9 CXCL9 CXCL9
MAP2K6 MAP2K6 MAP2K6
CXCL10 CXCL10 CXCL11
3つの列を一致させ、いくつの列にどの遺伝子があるかを確認したいと思います。希望の出力形式は次のとおりです。
CXCL9 3
MAP2K6 3
CXCL10 2
CXCL11 1
誰でも私を助けることができますか?時間が大幅に節約されます。
ベストアンサー1
sed
+sort
+uniq
解決策:
sed 's/[[:space:]]\+/\n/g' file | sort | uniq -c
出力:
2 CXCL10
1 CXCL11
3 CXCL9
3 MAP2K6