whileループで変数が奇妙に動作します。

Question

主な問題は、sed実行時に入力を提供しないことです。つまり、渡されたファイル名を含む周辺ループから継承されたstdinストリームを読み取りますls（最初の反復ですべて）。別の問題はリストファイルを使用していることですls（出力を正しく読むよりもファイル名を繰り返す方が簡単で安全ですls）。また、使用中のやや複雑な正規表現を考えると、コードを読むのは少し難しいです。

ファイルを繰り返すには、次のようにします。

for pathname in mgp*/mgm*.3/*.fna; do
   # ... use "$pathname" here ...
done

fastaファイルのパス名が与えられたら、サブディレクトリ名から3桁のゲノムコードを取得するには、次の手順を実行します$pathname。

genome=${pathname%.3/*.fna}     # trim off tail
genome=${genome#mgp*/mgm????}   # trim off head

322たとえば、in $genomefrom mgp83581/mgm4729322.3/blah.fnainを指定します$pathname。

同じ方法でプロジェクト番号を取得します。

project=${pathname%/mgm*.3/*.fna}   # trim off tail
project=${project#mgp}              # trim off head

それは$projectなる83581でしょ$genomeう322。

>すべてのファスタファイルで行が開始されるたびにそれらを挿入するには、次の手順を実行します。

for pathname in mgp*/mgm*.3/*.fna; do
    genome=${pathname%.3/*.fna}     # trim off tail
    genome=${genome#mgp*/mgm????}   # trim off head

    project=${pathname%/mgm*.3/*.fna}   # trim off tail
    project=${project#mgp}              # trim off head

    sed -i .old "s/^>/>${project}_${genome}_/" "$pathname"
done

これにより、サフィックス付きの古いファイルも追加でバックアップされます.old。

注: にコピーあなたのデータ。利用可能なfastaファイルがなく、最終ループをテストしていません。

Answer 1