複数のヘッダーを持つファイルを1つにリンクする方法

複数のヘッダーを持つファイルを1つにリンクする方法

これを組み合わせる方法を提案できますか?

a.fastaには、ヘッダー1、2、3、....を含む10000個のシーケンスがあります。 10000 ............. ヘッダーヘッダーが 1 つだけ含まれています。例えば

>1
AAATTTTGGGGCCC
>2
ACCCCGGGTTT
..........
>10000
ATGCCCCCCCCCC

出力:

>1
AAATTTTGGGGCCCACCCCGGGTTTATGCCCCCCCCCC

ベストアンサー1

awk '
    /^>/ { 
        # print the first header
        if (c++ == 0) {print; print ""} 
        next
    } 
    /^$/ {next} 
    {printf "%s", $0} 
    END {print ""}
' a.fasta > b.fasta

b.fastaの内容

>1

AAATTTTGGGGCCCACCCCGGGTTT..........ATGCCCCCCCCCC

おすすめ記事