CSVファイルを最初の列（ヘッダーを含む）で分割する方法は？

Question

この GNU awk コマンドはこの問題を解決できます。

awk -F ',' 'NR==1{h=$0; next};!seen[$1]++{f=$1".csv"; print h > f};{f=$1".csv"; print >> f; close(f)}' input.csv

警告：最初のフィールドにエスケープされたカンマがあると機能しません。他の分野のカンマは正常に動作します。

説明する：

-F ','（フィールド区切り文字）$1などがスペースで区切られた値ではなくCSV列を参照していることを確認してください。
NR==1{h=$0; next}NR==1ヘッダー行全体を変数h（）に保存し、その行（）をスキップしてh=$0最初の行（）を特別に処理しますnext。
!seen[$1]++{f=$1".csv"; print h > f}$1特殊文字（）が最初に発生した場合は、次の項目をfilename変数に保存し、ヘッダーを対応するファイル（）に保存して処理します。!seen[$1]$1.csvfprint h > f
{f=$1".csv"; print >> f; close(f)}現在の行をファイルに追加し（）、print >> fファイル記述子を閉じて（close(f)）、特定のIDを持つすべての行が処理された後にその行が保持されないようにします。

ボーナス：別のフィールドに置き換えると、期待$1どおりに機能するはずです。つまり、特定の列にその値を含む行を含むその列の各固有値のファイルを生成する必要があります。

Answer 1

この GNU awk コマンドはこの問題を解決できます。

awk -F ',' 'NR==1{h=$0; next};!seen[$1]++{f=$1".csv"; print h > f};{f=$1".csv"; print >> f; close(f)}' input.csv

警告：最初のフィールドにエスケープされたカンマがあると機能しません。他の分野のカンマは正常に動作します。

説明する：

-F ','（フィールド区切り文字）$1などがスペースで区切られた値ではなくCSV列を参照していることを確認してください。
NR==1{h=$0; next}NR==1ヘッダー行全体を変数h（）に保存し、その行（）をスキップしてh=$0最初の行（）を特別に処理しますnext。
!seen[$1]++{f=$1".csv"; print h > f}$1特殊文字（）が最初に発生した場合は、次の項目をfilename変数に保存し、ヘッダーを対応するファイル（）に保存して処理します。!seen[$1]$1.csvfprint h > f
{f=$1".csv"; print >> f; close(f)}現在の行をファイルに追加し（）、print >> fファイル記述子を閉じて（close(f)）、特定のIDを持つすべての行が処理された後にその行が保持されないようにします。

ボーナス：別のフィールドに置き換えると、期待$1どおりに機能するはずです。つまり、特定の列にその値を含む行を含むその列の各固有値のファイルを生成する必要があります。

おすすめ記事