Numpy 配列から Pandas DataFrame を作成する: インデックス列と列ヘッダーを指定するにはどうすればよいですか? 質問する

2024-07-05 • tag-icon

Numpy 配列から Pandas DataFrame を作成する: インデックス列と列ヘッダーを指定するにはどうすればよいですか? 質問する

以下に示すように、行ラベルと列名を持つ 2 次元配列を表す、リストのリストから構成される Numpy 配列があります。

data = np.array([['','Col1','Col2'],['Row1',1,2],['Row2',3,4]])

結果の DataFrame にRow1、Row2インデックス値としてとCol1、Col2ヘッダー値としてが含まれるようにします。

インデックスは次のように指定できます。

df = pd.DataFrame(data, index=data[:,0])

ただし、列ヘッダーを最適に割り当てる方法がわかりません。

ベストアンサー1

を指定してdata、indexcolumnsDataFrameコンストラクターは次のようになります。

>>> pd.DataFrame(data=data[1:,1:],    # values
...              index=data[1:,0],    # 1st column as index
...              columns=data[0,1:])  # 1st row as the column names

@joris として言及np.int_(data[1:,1:])正しいデータ型にするには、上記をに変更する必要がある場合があります。

ベストアンサー1

おすすめ記事