ファイルの遺伝子列を比較し、Linuxに存在する遺伝子と列の数を出力します。

ファイルの遺伝子列を比較し、Linuxに存在する遺伝子と列の数を出力します。

このようなファイルには3つのゲノムがあります

col1    col2    col3
CXCL9   CXCL9   CXCL9
MAP2K6  MAP2K6  MAP2K6
CXCL10  CXCL10  CXCL11

3つの列を一致させ、いくつの列にどの遺伝子があるかを確認したいと思います。希望の出力形式は次のとおりです。

CXCL9 3
MAP2K6 3
CXCL10 2
CXCL11 1

誰でも私を助けることができますか?時間が大幅に節約されます。

ベストアンサー1

sed+sort+uniq解決策:

sed 's/[[:space:]]\+/\n/g' file | sort | uniq -c

出力:

  2 CXCL10
  1 CXCL11
  3 CXCL9
  3 MAP2K6

おすすめ記事