これを組み合わせる方法を提案できますか?
a.fastaには、ヘッダー1、2、3、....を含む10000個のシーケンスがあります。 10000 ............. ヘッダーヘッダーが 1 つだけ含まれています。例えば
>1
AAATTTTGGGGCCC
>2
ACCCCGGGTTT
..........
>10000
ATGCCCCCCCCCC
出力:
>1
AAATTTTGGGGCCCACCCCGGGTTTATGCCCCCCCCCC
ベストアンサー1
awk '
/^>/ {
# print the first header
if (c++ == 0) {print; print ""}
next
}
/^$/ {next}
{printf "%s", $0}
END {print ""}
' a.fasta > b.fasta
b.fastaの内容
>1
AAATTTTGGGGCCCACCCCGGGTTT..........ATGCCCCCCCCCC