Numpy 配列から Pandas DataFrame を作成する: インデックス列と列ヘッダーを指定するにはどうすればよいですか? 質問する

Numpy 配列から Pandas DataFrame を作成する: インデックス列と列ヘッダーを指定するにはどうすればよいですか? 質問する

以下に示すように、行ラベルと列名を持つ 2 次元配列を表す、リストのリストから構成される Numpy 配列があります。

data = np.array([['','Col1','Col2'],['Row1',1,2],['Row2',3,4]])

結果の DataFrame にRow1Row2インデックス値として とCol1Col2ヘッダー値として が含まれるようにします。

インデックスは次のように指定できます。

df = pd.DataFrame(data, index=data[:,0])

ただし、列ヘッダーを最適に割り当てる方法がわかりません。

ベストアンサー1

を指定してdataindexcolumnsDataFrameコンストラクターは次のようになります。

>>> pd.DataFrame(data=data[1:,1:],    # values
...              index=data[1:,0],    # 1st column as index
...              columns=data[0,1:])  # 1st row as the column names

@joris として言及np.int_(data[1:,1:])正しいデータ型にするには、上記を に変更する必要がある場合があります。

おすすめ記事