ファイルからデータを抽出し、内容を操作して新しいファイルに書き込みます。

Question

GNUの使用awk:

awk -F, '!seen[$3 FS $9 FS $7]++ {
    cmd="echo \047" $9 "\047 | rev | tr ATCG TAGC";
    if ((cmd |getline $9)>0){ print $3, $9, $7; };
    close(cmd);
}' OFS=, infile

出力：

188823,TGGTACAG,ACTCTCGA
189843,TGTACAAG,ACCCTGGA

NR>2コマンドに追加すると、awk 'NR>2{ ...; }'入力の最初の2行をスキップするように機能します。

ここでは[getlineパイプから変数への変換] cmd="..." $9 "..." （外部コマンドに関連する項目だけが二重引用符で囲まれています。）次に、パイプから呼び出してgetline同じフィールドに結果を保存し、$9結果getlineが成功すると出力に必須フィールドを印刷します。

最後に、閉鎖（ガイドライン)これ注文する我々は開いた。

!seen[$3 FS $9 FS $7]++処理フィールド＃3、＃9、＃7の重複行を無視するために使用されます。

Answer 1

GNUの使用awk:

awk -F, '!seen[$3 FS $9 FS $7]++ {
    cmd="echo \047" $9 "\047 | rev | tr ATCG TAGC";
    if ((cmd |getline $9)>0){ print $3, $9, $7; };
    close(cmd);
}' OFS=, infile

出力：

188823,TGGTACAG,ACTCTCGA
189843,TGTACAAG,ACCCTGGA

NR>2コマンドに追加すると、awk 'NR>2{ ...; }'入力の最初の2行をスキップするように機能します。

ここでは[getlineパイプから変数への変換] cmd="..." $9 "..." （外部コマンドに関連する項目だけが二重引用符で囲まれています。）次に、パイプから呼び出してgetline同じフィールドに結果を保存し、$9結果getlineが成功すると出力に必須フィールドを印刷します。

最後に、閉鎖（ガイドライン)これ注文する我々は開いた。

!seen[$3 FS $9 FS $7]++処理フィールド＃3、＃9、＃7の重複行を無視するために使用されます。

ファイルからデータを抽出し、内容を操作して新しいファイルに書き込みます。

ベストアンサー1

おすすめ記事