列ヘッダーに基づいてファイルの列をマージする

Question

入力内容がタブ区切りの場合：

awk -F"\t" '
NR == 1 {for (i=1; i<=NF; i++)  COL[i] = $i
        }
        {for (i=1; i<=NF; i++) OUT[NR, COL[i]] = $i
        }
END     {for (n=1; n<=NR; n++)  {split ("", DUP)
                                 for (i=1; i<=NF; i++)  if (!DUP[COL[i]]++) printf "%s" FS, OUT[n,COL[i]]
                                 printf RS
                                }
        }
' file
A   B   C   
1   5   4   
3   1   2   
2   2   1   
1       3   
3       2   
1       4

後で部分索引として使用するために列ヘッダーを保存し、各行の値を行番号とヘッダー部分索引で索引付けされた配列に収集します。このENDセクションでは、配列を元の順序で印刷し、重複した列ヘッダーを処理します。

より複雑なファイル構造の場合、反復処理が主な作業になる可能性があります。

Answer 1

入力内容がタブ区切りの場合：

awk -F"\t" '
NR == 1 {for (i=1; i<=NF; i++)  COL[i] = $i
        }
        {for (i=1; i<=NF; i++) OUT[NR, COL[i]] = $i
        }
END     {for (n=1; n<=NR; n++)  {split ("", DUP)
                                 for (i=1; i<=NF; i++)  if (!DUP[COL[i]]++) printf "%s" FS, OUT[n,COL[i]]
                                 printf RS
                                }
        }
' file
A   B   C   
1   5   4   
3   1   2   
2   2   1   
1       3   
3       2   
1       4

後で部分索引として使用するために列ヘッダーを保存し、各行の値を行番号とヘッダー部分索引で索引付けされた配列に収集します。このENDセクションでは、配列を元の順序で印刷し、重複した列ヘッダーを処理します。

より複雑なファイル構造の場合、反復処理が主な作業になる可能性があります。

列ヘッダーに基づいてファイルの列をマージする

ベストアンサー1

おすすめ記事