pandasを使用して日付による値の頻度をカウントする質問する

Question

Series を DataFrame に変換して Pandas のgroupby機能を使用するのが最も簡単かもしれません (すでに DataFrame がある場合は、以下の別の列の追加に直接進んでください)。

Series がと呼ばれる場合はs、次のように DataFrame に変換します。

>>> df = pd.DataFrame({'Timestamp': s.index, 'Category': s.values})
>>> df
       Category           Timestamp
0      Facebook 2014-10-16 15:05:17
1         Vimeo 2014-10-16 14:56:37
2      Facebook 2014-10-16 14:25:16
...

次に、週と年用の別の列を追加します (1 つの方法は、apply週/年番号の文字列を使用して生成することです)。

>>> df['Week/Year'] = df['Timestamp'].apply(lambda x: "%d/%d" % (x.week, x.year))
>>> df
             Timestamp     Category Week/Year
0  2014-10-16 15:05:17     Facebook   42/2014
1  2014-10-16 14:56:37        Vimeo   42/2014
2  2014-10-16 14:25:16     Facebook   42/2014
...

最後に、でグループ化し'Week/Year'、'Category'で集計してsize()カウントを取得します。質問のデータの場合、次の結果が生成されます。

>>> df.groupby(['Week/Year', 'Category']).size()
Week/Year  Category   
41/2014    DailyMotion    1
           Facebook       3
           Vimeo          2
           Youtube        3
42/2014    Facebook       7
           Orkut          1
           Vimeo          1

Answer 1

Series を DataFrame に変換して Pandas のgroupby機能を使用するのが最も簡単かもしれません (すでに DataFrame がある場合は、以下の別の列の追加に直接進んでください)。

Series がと呼ばれる場合はs、次のように DataFrame に変換します。

>>> df = pd.DataFrame({'Timestamp': s.index, 'Category': s.values})
>>> df
       Category           Timestamp
0      Facebook 2014-10-16 15:05:17
1         Vimeo 2014-10-16 14:56:37
2      Facebook 2014-10-16 14:25:16
...

次に、週と年用の別の列を追加します (1 つの方法は、apply週/年番号の文字列を使用して生成することです)。

>>> df['Week/Year'] = df['Timestamp'].apply(lambda x: "%d/%d" % (x.week, x.year))
>>> df
             Timestamp     Category Week/Year
0  2014-10-16 15:05:17     Facebook   42/2014
1  2014-10-16 14:56:37        Vimeo   42/2014
2  2014-10-16 14:25:16     Facebook   42/2014
...

最後に、でグループ化し'Week/Year'、'Category'で集計してsize()カウントを取得します。質問のデータの場合、次の結果が生成されます。

>>> df.groupby(['Week/Year', 'Category']).size()
Week/Year  Category   
41/2014    DailyMotion    1
           Facebook       3
           Vimeo          2
           Youtube        3
42/2014    Facebook       7
           Orkut          1
           Vimeo          1

pandasを使用して日付による値の頻度をカウントする質問する

ベストアンサー1

おすすめ記事