バイオインフォマティクスでマルチファスタファイルのヘッダー名を変更する

バイオインフォマティクスでマルチファスタファイルのヘッダー名を変更する

これは標準のfasta形式ファイルではなく、私のfile1.fa(seqID、\ t、シーケンス)です。

abc MFSKPTKAPLNKGQEAVAKEFFDFLLDPNATEFNISGPGGTGKTFLMSHLIDDTMPA
cef AFSKPTKAPLNKGQEAVAKEFFDFLLDPNATEFNESGPGGTGKTFLMSHLIDDTMFA
rig AAAAAAAAAAAAAAAAAAAAAAAAAAGGEGKFKKKKKSKKKKKKKKKKKKKKKKKKK

それでは、次のように標準のfasta形式に変換したいと思います。

>abc
MFSKPTKAPLNKGQEAVAKEFFDFLLDPNATEFNISGPGGTGKTFLMSHLIDDTMPA
>cef 
AFSKPTKAPLNKGQEAVAKEFFDFLLDPNATEFNESGPGGTGKTFLMSHLIDDTMFA
>rig 
AAAAAAAAAAAAAAAAAAAAAAAAAAGGEGKFKKKKKSKKKKKKKKKKKKKKKKKKK

このようなことを試しましたが、「>」を追加する方法がわかりません。誰でも助けることができますか?

less -S file1.fa | sed 's/\t/\n/g' > file2.fa

ベストアンサー1

sed 代わりに単に使用することもできますless。ファイルを編集することもできます。所定の位置に出力を新しいファイルにリダイレクトせずに。

あなたのsedコマンドは次のとおりです

sed -i'.bak' 's/\(.*\)\t/>\1\n/g' file1.fa

または編集したくない場合所定の位置にあなたはそれを使用することができます:

sed  's/\(.*\)\t/>\1\n/g' file1.fa > file2.fa

おすすめ記事