Pandasのmap、applymap、applyメソッドの違い 質問する

Pandasのmap、applymap、applyメソッドの違い 質問する

基本的な例を挙げて、これらのベクトル化手法をいつ使用すればよいか教えてください。

はメソッドmapですSeriesが、残りはメソッドです。ただし、とメソッドDataFrameについては混乱しました。関数を DataFrame に適用するのに 2 つのメソッドがあるのはなぜですか? 繰り返しになりますが、使用方法を示す簡単な例があると便利です。applyapplymap

ベストアンサー1

applyDataFrameの行/列単位で動作します
applymap。DataFrameの要素単位で動作します。Series
mapの要素単位で動作します。


ウェス・マッキニーから直接データ分析のためのPython本書、132ページ(私はこの本を強く推薦します):

もう一つのよくある操作は、1D 配列の各列または行に関数を適用することです。DataFrame の apply メソッドはまさにこれを実行します。

In [116]: frame = DataFrame(np.random.randn(4, 3), columns=list('bde'), index=['Utah', 'Ohio', 'Texas', 'Oregon'])

In [117]: frame
Out[117]: 
               b         d         e
Utah   -0.029638  1.081563  1.280300
Ohio    0.647747  0.831136 -1.549481
Texas   0.513416 -0.884417  0.195343
Oregon -0.485454 -0.477388 -0.309548

In [118]: f = lambda x: x.max() - x.min()

In [119]: frame.apply(f)
Out[119]: 
b    1.133201
d    1.965980
e    2.829781
dtype: float64

最も一般的な配列統計 (合計や平均など) の多くは DataFrame メソッドであるため、apply を使用する必要はありません。

要素ごとの Python 関数も使用できます。フレーム内の各浮動小数点値からフォーマットされた文字列を計算したいとします。これは、applymap を使用して実行できます。

In [120]: format = lambda x: '%.2f' % x

In [121]: frame.applymap(format)
Out[121]: 
            b      d      e
Utah    -0.03   1.08   1.28
Ohio     0.65   0.83  -1.55
Texas    0.51  -0.88   0.20
Oregon  -0.49  -0.48  -0.31

applymap という名前が付けられている理由は、Series には要素ごとに関数を適用するための map メソッドがあるためです。

In [122]: frame['e'].map(format)
Out[122]: 
Utah       1.28
Ohio      -1.55
Texas      0.20
Oregon    -0.31
Name: e, dtype: object

おすすめ記事