awkファイルの操作

2024-06-20 • tag-icon

awk

この形式の大容量ファイルがありますが、ヘッダーを含む最初の数行を表示します。

gene    c1  c2  c3  c4  c5  c6  c7  c8
G1*1    0   0   0   0   0   0   0   0
G2*2    0   0   0   0   1   1   1   1
G3*3    0   0   2   2   44  44  62  62
G4*4    22  0   46  0   1308    7   1773    4

遺伝子の最初の行はヘッダー行です。そのままにして、残りの行をFS = *に分割して、このようなファイルを出力にしたいと思います。

gene    coord   c1  c2  c3  c4  c5  c6  c7  c8
G1  1   0   0   0   0   0   0   0   0
G2  2   0   0   0   0   1   1   1   1
G3  3   0   0   2   2   44  44  62  62
G4  4   22  0   46  0   1308    7   1773    4

したがって、ヘッダー行に「coord」という追加のフィールドを追加して、後続の行を分割するときにすべての項目がソートされるようにしたいと思います。

awkを使用して分割する方法を知っていますが、ヘッダー行が混乱しています。

awk -F '*' -v OFS="\t" '{print $1,$2}' ##This is for 2nd line and onwards

ベストアンサー1

ヘッダー行は特別なケースなので、そうすることができます。

awk -F '*' -v OFS='\t' \
  'NR == 1 { sub(/^gene/, "&" OFS "coord"); print; next }
  { print $1, $2 }'

ベストアンサー1

おすすめ記事