ループの引数としてawk出力パイプ

Question

EnsEMBLの変形効果予測器は基本的に標準入力（ここのドキュメント）。

つまり、-iこのオプション（およびそのオプション引数）を完全に省略すると、パイプから入力が読み取られます。

パイプラインで何をしたいのかわかりませんが、別のファイルから読み取って特定の識別子を別の識別子に置き換えようとしているようです。これはawk役に立たないバックスラッシュのあるプログラムを使うことです。コマンドawkは次のように書くことができます。

awk 'BEGIN { FS=OFS="\t" } NR == FNR { key[$1]=$2; next} ($1 in key) { $1=key[$1] } 1' map -

入力-ファイル名awkに達すると、標準入力から読み込まれます（名前付きファイルを処理した後map）。

awkパイプラインが提供するより強力な言語であり、簡単に統合してcutコーディングsedできます。

awk 'BEGIN { FS=OFS="\t" } NR == FNR { key[$1]=$2; next} ($1 in key) { $1=key[$1] } FNR > 6 { print $1, $2, $3, $4, $5, $6 }' map -

あなたのスクリプトは次のとおりです

#!/bin/sh

for file in ./*.vcf.gz; do
    gzip -cd "$file" |
    awk 'BEGIN { FS=OFS="\t" } NR == FNR { key[$1]=$2; next} ($1 in key) { $1=key[$1] } FNR > 6 { print $1, $2, $3, $4, $5, $6 }' map - |
    vep -o "${file}_dnds" --compress_output gzip --dir_cache ./ 
done

（変数拡張の正しい二重引用符も参照してください）

.vcf.gz出力ファイルの末尾にファイル名サフィックスを追加する前に、出力ファイル名からファイル名サフィックスを削除します。_dndsvep -o "${file%.vcf.gz}_dnds" ...

Answer 1