CSV列レイアウトの変更

CSV列レイアウトの変更

CSVファイルをインポートして列レイアウトを調整する良い解決策を持っている人はいますか?

たとえば、ヘッダー+データを含むファイルがあります。

foo,bar,baz
1,2,3

しかし、列レイアウトを次のように変更したいと思います。

qux,foo,waldo,fred,bar,baz

生成されたデータファイルは次のとおりです。

qux,foo,waldo,fred,bar,baz
,1,,,2,3

私はCSVKitや他のコマンドラインツールを使ってきました。これは、列調整ではなく、データセットのマージ/操作に重点を置いたようです。

一般的でスケーラブルなソリューションのアイデアはありますか?

ベストアンサー1

これを行う方法はいくつかあります。使いやすさと拡張性のために、Pythonとこのpandasライブラリを使用することをお勧めします。必要な主な機能は次のとおりですpandas.read_csv()dataframe.to_csv()これはpandasオンライン参照(pd.read_csvデータフレーム.to_csv)。

import pandas as pd
df = pd.read_csv('input.csv')
df.reindex(columns=['qux','foo','waldo','fred','bar','baz']).to_csv('outfile.csv')

おすすめ記事