次の文字列を含むファイルがたくさんあります。
>33100_Pseudomonas_etcetera1
texttexttext
>33632_Pseudomonas_etcetera2
texttexttext
>36406_Pseudomonas_etcetera3
texttexttext
次の出力が必要です。
>Pseudomomas_etcetera1
texttexttext
>Pseudomomas_etcetera2
texttexttext
>Pseudomomas_etcetera3
texttexttext
単純なsedソリューションがあると確信していますが、理解できないようです。
注:文字は常に5桁の数字で、その後に下線、疑似モナスなどが続きます。文字列は常にその行の先頭にあり、常に「>」で始まります。すべてのファイルには「.sorted」拡張子があります。
ベストアンサー1
sed
できる:
sed -E 's/>([0-9]+_)(\w+)/>\2/' files
パターンにまったく問題がある場合:
sed -E 's/([0-9]+_)//' files
-E
拡張正規表現の使用([0-9]+_)(\w+)
2つの定義フォントあなたがそれらを訪問する地域\1そして\2。