各列に異なる値の範囲がある pandas のデータフレームがあります。例:
フリーダム:
A B C
1000 10 0.5
765 5 0.35
800 7 0.09
各値が 0 から 1 の間であるこのデータフレームの列を正規化する方法を教えてください。
希望する出力は次のとおりです。
A B C
1 1 1
0.765 0.5 0.7
0.8 0.7 0.18(which is 0.09/0.5)
ベストアンサー1
Pandasを使用する簡単な方法: (ここでは平均正規化を使用します)
normalized_df=(df-df.mean())/df.std()
最小最大正規化を使用するには:
normalized_df=(df-df.min())/(df.max()-df.min())
編集: いくつかの懸念に対処するために、上記のコードでは Pandas が列単位の関数を自動的に適用することを述べる必要があります。