シリーズにカテゴリ変数があります。それぞれの一意の値に整数 ID を割り当て、その ID を使用して新しいシリーズを作成し、文字列変数を整数変数に変換したいと考えています。これを行う最もコンパクトで効率的な方法は何ですか?
ベストアンサー1
使用できるパンダの因数分解:
In [32]: s = pd.Series(['a','b','c'])
In [33]: labels, levels = pd.factorize(s)
In [35]: labels
Out[35]: array([0, 1, 2])