次の一致の前に、一致とすべての項目を抽出します。各一致に対してこれを行います。

Question

awkではこれを簡単に行うことができます。

awk '{ if(/^>/){name=$0; sub(/^>/,"", name);}{print >> name".fa"}}' file.fa

これは入力ファイルのすべての行を繰り返し、最初の文字がこの場合は行をとして>保存します。次に、ファイル名にその内容を望まないので、から内容を削除nameします。最後に、各行は現在のシーケンスの名前が何であれ、whereというファイルに追加されます。>namename.faname

N行より長いシーケンスのみを印刷するには、次のものを使用できます。

awk -v min=4 '{ 
               if(/^>/){ 
                    if(num >= min){
                        print seq >> name".fa"
                    } 
                    name=$0; 
                    sub(/^>/,"", name); 
                    seq=$0; 
                    num=0
                }
                else{
                    seq = seq"\n"$0; 
                    num++
                }
               }
               END{
                 if(num >= min){
                    print seq >> name".fa"
                 }
               }' file.fa

基本原則として、テキスト処理にシェルループを使用しないでください。ゆっくりと這い、エラーが発生しやすい。

Answer 1

awkではこれを簡単に行うことができます。

awk '{ if(/^>/){name=$0; sub(/^>/,"", name);}{print >> name".fa"}}' file.fa

これは入力ファイルのすべての行を繰り返し、最初の文字がこの場合は行をとして>保存します。次に、ファイル名にその内容を望まないので、から内容を削除nameします。最後に、各行は現在のシーケンスの名前が何であれ、whereというファイルに追加されます。>namename.faname

N行より長いシーケンスのみを印刷するには、次のものを使用できます。

awk -v min=4 '{ 
               if(/^>/){ 
                    if(num >= min){
                        print seq >> name".fa"
                    } 
                    name=$0; 
                    sub(/^>/,"", name); 
                    seq=$0; 
                    num=0
                }
                else{
                    seq = seq"\n"$0; 
                    num++
                }
               }
               END{
                 if(num >= min){
                    print seq >> name".fa"
                 }
               }' file.fa

基本原則として、テキスト処理にシェルループを使用しないでください。ゆっくりと這い、エラーが発生しやすい。

次の一致の前に、一致とすべての項目を抽出します。各一致に対してこれを行います。

ベストアンサー1

おすすめ記事