パンダシリーズを文字列から一意のint IDに変換する [重複] 質問する

パンダシリーズを文字列から一意のint IDに変換する [重複] 質問する

シリーズにカテゴリ変数があります。それぞれの一意の値に整数 ID を割り当て、その ID を使用して新しいシリーズを作成し、文字列変数を整数変数に変換したいと考えています。これを行う最もコンパクトで効率的な方法は何ですか?

ベストアンサー1

使用できるパンダの因数分解:

In [32]: s = pd.Series(['a','b','c'])

In [33]: labels, levels = pd.factorize(s)

In [35]: labels
Out[35]: array([0, 1, 2])

おすすめ記事