fastaファイルの各タンパク質シーケンスの末尾から*を削除する方法

Question

そしてsed。たとえば、

$ printf ">seq1\nMSDGFHS*\n>Seq2\nMSDRFH*\n" | sed -e 's/\*$//'
>seq1
MSDGFHS
>Seq2
MSDRFH

*これにより、行の末尾にあるすべてのアスタリスク文字（）が削除されます。

sedの-iオプションを使用してソースファイルを編集できます。あるいはsed、MUSCLEの出力を新しいfastaファイルにリダイレクトし、それをMUSCLEの入力として使用する方が良いでしょう（通常、他のプログラムでも元のファイルを使用する必要がある場合に最適です）。いいえ情報永久削除 - データが削除された場合に回復できるという保証はありません。特定の目的のためにファイルの一時修正バージョンを使用するのと同じように、常にバックアップを取ることをお勧めします。

Answer 1

そしてsed。たとえば、

$ printf ">seq1\nMSDGFHS*\n>Seq2\nMSDRFH*\n" | sed -e 's/\*$//'
>seq1
MSDGFHS
>Seq2
MSDRFH

*これにより、行の末尾にあるすべてのアスタリスク文字（）が削除されます。

sedの-iオプションを使用してソースファイルを編集できます。あるいはsed、MUSCLEの出力を新しいfastaファイルにリダイレクトし、それをMUSCLEの入力として使用する方が良いでしょう（通常、他のプログラムでも元のファイルを使用する必要がある場合に最適です）。いいえ情報永久削除 - データが削除された場合に回復できるという保証はありません。特定の目的のためにファイルの一時修正バージョンを使用するのと同じように、常にバックアップを取ることをお勧めします。

fastaファイルの各タンパク質シーケンスの末尾から*を削除する方法

ベストアンサー1

おすすめ記事