複数のヘッダーを持つファイルを1つにリンクする方法

2024-06-18 • tag-icon

text-processing

これを組み合わせる方法を提案できますか？

a.fastaには、ヘッダー1、2、3、....を含む10000個のシーケンスがあります。 10000 ............. ヘッダーヘッダーが 1 つだけ含まれています。例えば

>1
AAATTTTGGGGCCC
>2
ACCCCGGGTTT
..........
>10000
ATGCCCCCCCCCC

出力：

>1
AAATTTTGGGGCCCACCCCGGGTTTATGCCCCCCCCCC

ベストアンサー1

awk '
    /^>/ { 
        # print the first header
        if (c++ == 0) {print; print ""} 
        next
    } 
    /^$/ {next} 
    {printf "%s", $0} 
    END {print ""}
' a.fasta > b.fasta

b.fastaの内容

>1

AAATTTTGGGGCCCACCCCGGGTTT..........ATGCCCCCCCCCC

ベストアンサー1

おすすめ記事