ファイルから「>」と「バクテリア」という単語の間の部分を削除するにはどうすればよいですか？

Question

ヘッダーがaで始まり、行の空白ではなく最初の文字としてのみ表示される複数のヘッダーとシーケンス行を含むfastaファイルであると仮定すると、>次の>ことができます。

sed 's/^ *>[^ ]* />/' file.fa

これにより、ゼロ個以上のスペースで始まり、その後にaと行が続く行を見つけ、行の先頭>から>最初のスペースまですべてを置き換えて、>最初のスペースの前のすべてを効果的に削除します。

標準出力として印刷するのではなく、元のファイルを編集するには、次のようにします。

sed -i.bak 's/^ *>[^ ]* />/' file.fa

file.fa.bakこれにより、元のファイルのコピーになるというファイルが作成されます。

Answer 1

ヘッダーがaで始まり、行の空白ではなく最初の文字としてのみ表示される複数のヘッダーとシーケンス行を含むfastaファイルであると仮定すると、>次の>ことができます。

sed 's/^ *>[^ ]* />/' file.fa

これにより、ゼロ個以上のスペースで始まり、その後にaと行が続く行を見つけ、行の先頭>から>最初のスペースまですべてを置き換えて、>最初のスペースの前のすべてを効果的に削除します。

標準出力として印刷するのではなく、元のファイルを編集するには、次のようにします。

sed -i.bak 's/^ *>[^ ]* />/' file.fa

file.fa.bakこれにより、元のファイルのコピーになるというファイルが作成されます。

おすすめ記事