Pandasでグループごとに一意の値をカウントする [重複] 質問する

Question

必要なのはnunique:

df = df.groupby('domain')['ID'].nunique()

print (df)
domain
'facebook.com'    1
'google.com'      1
'twitter.com'     2
'vk.com'          3
Name: ID, dtype: int64

もしあなたが必要ならばstrip '文字:

df = df.ID.groupby([df.domain.str.strip("'")]).nunique()
print (df)
domain
facebook.com    1
google.com      1
twitter.com     2
vk.com          3
Name: ID, dtype: int64

またはジョン・クレメンツコメント:

df.groupby(df.domain.str.strip("'"))['ID'].nunique()

列名は次のように保持できます。

df = df.groupby(by='domain', as_index=False).agg({'ID': pd.Series.nunique})
print(df)
    domain  ID
0       fb   1
1      ggl   1
2  twitter   2
3       vk   3

違いは、nunique()Series を返し、agg()DataFrame を返すことです。

Answer 1

必要なのはnunique:

df = df.groupby('domain')['ID'].nunique()

print (df)
domain
'facebook.com'    1
'google.com'      1
'twitter.com'     2
'vk.com'          3
Name: ID, dtype: int64

もしあなたが必要ならばstrip '文字:

df = df.ID.groupby([df.domain.str.strip("'")]).nunique()
print (df)
domain
facebook.com    1
google.com      1
twitter.com     2
vk.com          3
Name: ID, dtype: int64

またはジョン・クレメンツコメント:

df.groupby(df.domain.str.strip("'"))['ID'].nunique()

列名は次のように保持できます。

df = df.groupby(by='domain', as_index=False).agg({'ID': pd.Series.nunique})
print(df)
    domain  ID
0       fb   1
1      ggl   1
2  twitter   2
3       vk   3

違いは、nunique()Series を返し、agg()DataFrame を返すことです。

Pandasでグループごとに一意の値をカウントする [重複] 質問する

ベストアンサー1

おすすめ記事