このようなファイルがあります。
>chr1
ACGTGGC
TGCCGTT
ATCCTTG
>chr2
ACTTTTA
CTCATAA
seqを1つの文字列に変換したいです。次のように出力する必要があります。
>chr1
ACGTGGCTGCCGTTATCCTTG
>chr2
ACTTTTACTCATAA
awkを使ってどうすればよいですか?私はPerlでこれを行う方法を知っています。
ありがとう
ベストアンサー1
期待どおりに動作します。
awk '/>chr/{if (x)print x;print;x="";next}{x=(!x)?$0:x$0;}END{print x;}' file
>chr1
ACGTGGCTGCCGTTATCCTTG
>chr2
ACTTTTACTCATAA