データフレームを生成するコードは次のとおりです。
import pandas as pd
import numpy as np
dff = pd.DataFrame(np.random.randn(1,2),columns=list('AB'))
次にデータフレームを取得します:
+------------+---------+--------+
| | A | B |
+------------+---------+---------
| 0 | 0.626386| 1.52325|
+------------+---------+--------+
次のコマンドを入力すると:
dff.mean(axis=1)
私が得たもの:
0 1.074821
dtype: float64
pandasのリファレンスによると、axis=1は列を表し、コマンドの結果は次のようになると予想されます。
A 0.626386
B 1.523255
dtype: float64
それで、私の質問は、パンダの axis はどういう意味ですか?
ベストアンサー1
平均を計算する軸を指定します。デフォルトでは です。これaxis=0
は、が明示的に指定されているnumpy.mean
場合( では、デフォルトでは axis==None で、平坦化された配列全体の平均値を計算します)、 では行(つまり、 pandas のインデックス)に沿って、列に沿って使用される使用法と一致しています。明確にするために、の代わりにまたは の代わりにを指定することもできます。axis
numpy.mean
axis=0
axis=1
axis='index'
axis=0
axis='columns'
axis=1
+------------+---------+--------+
| | A | B |
+------------+---------+---------
| 0 | 0.626386| 1.52325|----axis=1----->
+------------+---------+--------+
| |
| axis=0 |
↓ ↓