for ループは、単一のコマンドで親ファイルの複数のテキストを複数のファイルにインポートします。

Question

Fasta形式では、すべてのシーケンスが1行にある必要はありません。実際、ほとんどの生物学的配列は非常に長いので、これは一般的ではありません。したがって、grepIDシーケンスが1行を超えると、いずれの場合も失敗します。また、コマンドはという名前のファイルではなく名前のgrepファイルを生成します。SphingopyxisSphingopyxis alaskensis RB2256.fa

とにかく、各シーケンスを種の後ろにファイル名に入れて、次のようにすることができます。

awk -F'[][]' '/>/{n=$2}; {print >> n".fa"}' *.fa

ただし、ファイル名にスペースを使用しないことをお勧めします。スペースを使用すると、作業が難しくなります。より安全なアプローチは次のとおりです。

awk -F'[][]' '/>/{n=$2; gsub(/ /,"_",n)}; {print >> n".fa"}' *.fa

gsub種名のすべてのスペースを置き換えると、_次のファイルが生成されます。

Leptospirillum_ferriphilum_ML-04.fa  Sphingopyxis_alaskensis_RB2256.fa

上記の両方の方法は、複数行のシーケンスを処理できます。

Answer 1

Fasta形式では、すべてのシーケンスが1行にある必要はありません。実際、ほとんどの生物学的配列は非常に長いので、これは一般的ではありません。したがって、grepIDシーケンスが1行を超えると、いずれの場合も失敗します。また、コマンドはという名前のファイルではなく名前のgrepファイルを生成します。SphingopyxisSphingopyxis alaskensis RB2256.fa

とにかく、各シーケンスを種の後ろにファイル名に入れて、次のようにすることができます。

awk -F'[][]' '/>/{n=$2}; {print >> n".fa"}' *.fa

ただし、ファイル名にスペースを使用しないことをお勧めします。スペースを使用すると、作業が難しくなります。より安全なアプローチは次のとおりです。

awk -F'[][]' '/>/{n=$2; gsub(/ /,"_",n)}; {print >> n".fa"}' *.fa

gsub種名のすべてのスペースを置き換えると、_次のファイルが生成されます。

Leptospirillum_ferriphilum_ML-04.fa  Sphingopyxis_alaskensis_RB2256.fa

上記の両方の方法は、複数行のシーケンスを処理できます。

for ループは、単一のコマンドで親ファイルの複数のテキストを複数のファイルにインポートします。

ベストアンサー1

おすすめ記事