ファイルの列を別のファイルのルックアップテーブルに置き換える

Question

これらの「カンマで区切られた複数値」は、カンマと（すべての場合ではありませんが、ほとんどの場合）スペースで区切られているため、操作が簡単になりません。フィールド区切り記号を調整し、各遺伝子を単一のフィールドとして機能させてください。

awk -F"[, \t]*" '
NR==FNR         {a[$2] = $1
                 next
                }
                {for (i=6; i<=NF; i++)  if ($i in a) sub($i, a[$i])
                }
1
' OFS="\t" Lookup_file input_file
Name    Start   Stop    Strand  Number of Genes Genes
op00001 1544    5454    +   2   g_00002, g_00001
op00002 7026    12012   +   2   g_00005, g_00004
op00003 15215   16854   -   3   g_00010,g_00002, g_00009
op00004 19856   25454   -   2   g_00010, g_00020
op00005 20791   23568   +   2   g_00006, g_00005

Answer 1

これらの「カンマで区切られた複数値」は、カンマと（すべての場合ではありませんが、ほとんどの場合）スペースで区切られているため、操作が簡単になりません。フィールド区切り記号を調整し、各遺伝子を単一のフィールドとして機能させてください。

awk -F"[, \t]*" '
NR==FNR         {a[$2] = $1
                 next
                }
                {for (i=6; i<=NF; i++)  if ($i in a) sub($i, a[$i])
                }
1
' OFS="\t" Lookup_file input_file
Name    Start   Stop    Strand  Number of Genes Genes
op00001 1544    5454    +   2   g_00002, g_00001
op00002 7026    12012   +   2   g_00005, g_00004
op00003 15215   16854   -   3   g_00010,g_00002, g_00009
op00004 19856   25454   -   2   g_00010, g_00020
op00005 20791   23568   +   2   g_00006, g_00005

ファイルの列を別のファイルのルックアップテーブルに置き換える

ベストアンサー1

おすすめ記事