ファイル名に文字列を追加して列に挿入して変更するにはどうすればよいですか？

Question

ファイルが示されているとおりに正しく呼び出されると仮定すると（文字列snpsの後に染色体名が続く場合）、次のようになります。

for name in snps*; do
    awk 'FNR == 1 { chr = substr(FILENAME, 5) }
         { printf("%s %s:%s:%s:%s\n", $1, chr, $2, $3, $4) }' "$name" >"$name.new"
done

これにより、次の方法でファイル名から染色体名が抽出されますsubstr()（染色体名は、ファイル名の5番目の文字から始まるすべての文字です）。FNR == 1これは、ファイルの最初の行（）を読むときにのみ行われます。その後、コードは現在の行を目的の形式で出力し、printf()染色体名を含みます。

その後、データは.newファイル名のサフィックスが付いたファイルに書き込まれます。

awk出力を作成する場所を選択してシェルループを削除できます。

awk 'FNR == 1 { chr = substr(FILENAME, 5); name = FILENAME ".new" }
     { printf("%s %s:%s:%s:%s\n", $1, chr, $2, $3, $4) >name }' snps*

すべての出力を1つのファイルに収集しますか？十分

awk 'FNR == 1 { chr = substr(FILENAME, 5) }
     { printf("%s %s:%s:%s:%s\n", $1, chr, $2, $3, $4) }' snps* >all_snps

.gen変更されたバリエーションを持つ元のファイルにも適用できます。

awk 'FNR == 1 { chr = substr(FILENAME, 4); sub("\.gen$", "", chr)
                name = "snps" chr }
     { printf("%s %s:%s:%s:%s\n", $1, chr, $3, $4, $5) >name }' chr*.gen

または単一出力ファイルの場合

awk 'FNR == 1 { chr = substr(FILENAME, 4); sub("\.gen$", "", chr) }
     { printf("%s %s:%s:%s:%s\n", $1, chr, $3, $4, $5) }' chr*.gen >all_snps

データから少し異なる列を選択して染色体名を見つけるには、ファイル名の他の部分を抽出します。

Answer 1