次の答えを見つけました。この便利なスレッドしかし、私の問題は十分に異なるので、良い答えを考えることはできません(少なくともsed
)。
次の行を含む大容量CSVファイル(200 GB以上)があります。
<alphanumerical_identifier>,<number>
ここでは<alphanumerical_identifier>
ファイル全体で一意です。別のファイルを作成したいです。最初の列をインデックスに置き換える、すなわち。
<index>,<number>
だから私たちは次のようになります:
1, <number>
2, <number>
3, <number>
awk
ファイル全体をメモリにロードせずに増分インデックスを作成できますか?
インデックスは単調に増加するため、インデックスを削除する方が良いかもしれません。解決策は違いますか?今すぐ:
<number>
<number>
<number>
ベストアンサー1
端末の近くでテストしませんが、しばしば見落とされるコマンドnl
はどうですか?それは次のとおりです。
cut -f 2 -d , original.csv | nl -w 1 -p -s , > numbered.csv