Pandas GroupBy マルチインデックス出力を Series から DataFrame に変換する 質問する

Pandas GroupBy マルチインデックス出力を Series から DataFrame に変換する 質問する

データフレームがあります:

   City     Name
0   Seattle    Alice
1   Seattle      Bob
2  Portland  Mallory
3   Seattle  Mallory
4   Seattle      Bob
5  Portland  Mallory

次のようなグループ化を実行します。

g1 = df1.groupby(["Name", "City"]).count()

印刷すると次のようになります:

                  City  Name
Name    City
Alice   Seattle      1     1
Bob     Seattle      2     2
Mallory Portland     2     2
        Seattle      1     1

しかし、最終的に必要なのは、GroupBy オブジェクト内のすべての行を含む別の DataFrame オブジェクトです。つまり、次の結果を取得したいのです。

                  City  Name
Name    City
Alice   Seattle      1     1
Bob     Seattle      2     2
Mallory Portland     2     2
Mallory Seattle      1     1

どうすればいいのですか?

ベストアンサー1

g1ここにDataFrameがあります。ただし、階層的なインデックスがあります。

In [19]: type(g1)
Out[19]: pandas.core.frame.DataFrame

In [20]: g1.index
Out[20]: 
MultiIndex([('Alice', 'Seattle'), ('Bob', 'Seattle'), ('Mallory', 'Portland'),
       ('Mallory', 'Seattle')], dtype=object)

おそらくあなたはこのようなものを望んでいるのでしょうか?

In [21]: g1.add_suffix('_Count').reset_index()
Out[21]: 
      Name      City  City_Count  Name_Count
0    Alice   Seattle           1           1
1      Bob   Seattle           2           2
2  Mallory  Portland           2           2
3  Mallory   Seattle           1           1

または次のようなもの:

In [36]: DataFrame({'count' : df1.groupby( [ "Name", "City"] ).size()}).reset_index()
Out[36]: 
      Name      City  count
0    Alice   Seattle      1
1      Bob   Seattle      2
2  Mallory  Portland      2
3  Mallory   Seattle      1

おすすめ記事