特定の列の値に基づいてファイルを分割する

Question

$ gawk '{print > "file" ++a[$1] ".txt"}' input

# And on OSX awk, and also gawk:

$ awk '{print > ("file" ++a[$1] ".txt")}' input


$ head file*txt
==> file1.txt <==
1    Cat
2    Boy
3    Tree

==> file2.txt <==
1    Dog
2    Girl
3    Leaf

==> file3.txt <==
1    Frog
3    Branch

==> file4.txt <==
3    Trunk

編集する：説明。これにより、現在の行が（>）に印刷されますfileX.txt。最初のフィールドが見つかるたびに、配列はa[$1]評価される前に1ずつ増えます。これはファイル名を設定するために使用されます。

編集2：OSX awkでは確認できませんでしたが、awkの使用について深刻ではない場合は、インストールしても問題ありgawkませんmawk。しかし、次のことを試すことができます。

$ awk '{a[$1]++; f = "file" a[$1] ".txt"; print > f}' input

同じことを行いますが、すべてが別々のステップに分かれています。これは、OSXがさまざまな部分を評価する正しい順序を理解するのに役立ちます。

Answer 1

$ gawk '{print > "file" ++a[$1] ".txt"}' input

# And on OSX awk, and also gawk:

$ awk '{print > ("file" ++a[$1] ".txt")}' input


$ head file*txt
==> file1.txt <==
1    Cat
2    Boy
3    Tree

==> file2.txt <==
1    Dog
2    Girl
3    Leaf

==> file3.txt <==
1    Frog
3    Branch

==> file4.txt <==
3    Trunk

編集する：説明。これにより、現在の行が（>）に印刷されますfileX.txt。最初のフィールドが見つかるたびに、配列はa[$1]評価される前に1ずつ増えます。これはファイル名を設定するために使用されます。

編集2：OSX awkでは確認できませんでしたが、awkの使用について深刻ではない場合は、インストールしても問題ありgawkませんmawk。しかし、次のことを試すことができます。

$ awk '{a[$1]++; f = "file" a[$1] ".txt"; print > f}' input

同じことを行いますが、すべてが別々のステップに分かれています。これは、OSXがさまざまな部分を評価する正しい順序を理解するのに役立ちます。

特定の列の値に基づいてファイルを分割する

ベストアンサー1

おすすめ記事