DNA配列に対するbashシェルコマンド

Question

通常、awknull/null フィールド区切り文字 (特定gawk) をサポートしている場合は、次のことができます (1 行あたりの数が必要な場合)。

gawk -F '' '{for (x=1;x<=NF;x++) arr[NR$x]++;
    for (i in arr) printf("%s:%d\t", i, arr[i]);delete arr;print ""}' infile

いいえ、列あたりの数が本当に必要な場合（フィールド区切り記号が空であると仮定）まず、入力データを列から行に変換してから、上記と同じ操作を実行する必要があります。

gawk -F '' '{for (x=1;x<=NF;x++) arr[NR$x]++;
    for (i in arr) printf("%s:%d\t", i, arr[i]);delete arr;print ""}' \
<(gawk -F '' '{for (i=1;i<=NF;i++) ctr[i]=ctr[i]$i} 
    END{for (i in ctr) print ctr[i]}' infile)

以下のスクリプトを使用してawk列を行に置き換えます。

gawk -F '' '{for (i=1;i<=NF;i++) ctr[i]=ctr[i]$i} 
    END{for (i in ctr) print ctr[i]}' infile

上記のコマンドの代わりに、次のコマンドを使用して移動できます。

sed 's/./& /g' in|datamash -t ' ' transpose |sed 's/ //g'

Answer 1

通常、awknull/null フィールド区切り文字 (特定gawk) をサポートしている場合は、次のことができます (1 行あたりの数が必要な場合)。

gawk -F '' '{for (x=1;x<=NF;x++) arr[NR$x]++;
    for (i in arr) printf("%s:%d\t", i, arr[i]);delete arr;print ""}' infile

いいえ、列あたりの数が本当に必要な場合（フィールド区切り記号が空であると仮定）まず、入力データを列から行に変換してから、上記と同じ操作を実行する必要があります。

gawk -F '' '{for (x=1;x<=NF;x++) arr[NR$x]++;
    for (i in arr) printf("%s:%d\t", i, arr[i]);delete arr;print ""}' \
<(gawk -F '' '{for (i=1;i<=NF;i++) ctr[i]=ctr[i]$i} 
    END{for (i in ctr) print ctr[i]}' infile)

以下のスクリプトを使用してawk列を行に置き換えます。

gawk -F '' '{for (i=1;i<=NF;i++) ctr[i]=ctr[i]$i} 
    END{for (i in ctr) print ctr[i]}' infile

上記のコマンドの代わりに、次のコマンドを使用して移動できます。

sed 's/./& /g' in|datamash -t ' ' transpose |sed 's/ //g'

DNA配列に対するbashシェルコマンド

ベストアンサー1

おすすめ記事