フォルダ内のすべてのファイルを見つけて置き換える特別なパターン

Question

実際のファイル名を表示することでこれを調整できますが、サンプル名が常に_ファイル名の最初の文字列の前に最も長い文字列であると仮定すると、次のことができます。

for file in *_R2.fastq.gz.fa; do
   sed -i '.bak' "s/\(>${file%%_*}\).*/\1/" "$file"
done

${file%%_*}より一般的には、or構文は${var%%pattern}「文字列の終わりで最も長いパターンの発生を取り除く」ために使用されるbash文字列操作です。ここで、パターンは_*最初の_から文字列の終わりまですべてを削除し、サンプル名は残します。これ-i '.bak'により、sed変更されたすべてのファイルのバックアップコピーが作成されます。必要でない場合は使用できますが、BSD（macOSの機能）では単独では使用-i ''できません。最後に、式は保持したい部分をキャプチャして保持し、残りは削除します。-isedsed\1

増加する数字（その外観）のみを削除したい場合は、1最初のSequence ID行、22番目のSequence ID行などから削除したい場合は、次のように直接実行できます。

perl -i '.bak' -pe '$k++ if />/; s/(>.+?)$k.*/$1/' *_R2.fastq.gz.fa

秘密は、aを見るたびに$k1つを追加し、aの値より前の値を保持し、残りを削除することです。>$k

Answer 1

実際のファイル名を表示することでこれを調整できますが、サンプル名が常に_ファイル名の最初の文字列の前に最も長い文字列であると仮定すると、次のことができます。

for file in *_R2.fastq.gz.fa; do
   sed -i '.bak' "s/\(>${file%%_*}\).*/\1/" "$file"
done

${file%%_*}より一般的には、or構文は${var%%pattern}「文字列の終わりで最も長いパターンの発生を取り除く」ために使用されるbash文字列操作です。ここで、パターンは_*最初の_から文字列の終わりまですべてを削除し、サンプル名は残します。これ-i '.bak'により、sed変更されたすべてのファイルのバックアップコピーが作成されます。必要でない場合は使用できますが、BSD（macOSの機能）では単独では使用-i ''できません。最後に、式は保持したい部分をキャプチャして保持し、残りは削除します。-isedsed\1

増加する数字（その外観）のみを削除したい場合は、1最初のSequence ID行、22番目のSequence ID行などから削除したい場合は、次のように直接実行できます。

perl -i '.bak' -pe '$k++ if />/; s/(>.+?)$k.*/$1/' *_R2.fastq.gz.fa

秘密は、aを見るたびに$k1つを追加し、aの値より前の値を保持し、残りを削除することです。>$k

フォルダ内のすべてのファイルを見つけて置き換える特別なパターン

ベストアンサー1

おすすめ記事