ネストされた辞書の項目からパンダの DataFrame を構築する質問する

Question

pandas MultiIndex はタプルのリストで構成されています。したがって、最も自然なアプローチは、入力辞書のキーが必要なマルチインデックス値に対応するタプルになるように再形成することです。その後、pd.DataFrame.from_dictオプションを使用して、データフレームを構築できますorient='index'。

user_dict = {12: {'Category 1': {'att_1': 1, 'att_2': 'whatever'},
                  'Category 2': {'att_1': 23, 'att_2': 'another'}},
             15: {'Category 1': {'att_1': 10, 'att_2': 'foo'},
                  'Category 2': {'att_1': 30, 'att_2': 'bar'}}}

pd.DataFrame.from_dict({(i,j): user_dict[i][j] 
                           for i in user_dict.keys() 
                           for j in user_dict[i].keys()},
                       orient='index')


               att_1     att_2
12 Category 1      1  whatever
   Category 2     23   another
15 Category 1     10       foo
   Category 2     30       bar

別の方法としては、コンポーネントデータフレームを連結してデータフレームを構築する方法があります。

user_ids = []
frames = []

for user_id, d in user_dict.iteritems():
    user_ids.append(user_id)
    frames.append(pd.DataFrame.from_dict(d, orient='index'))

pd.concat(frames, keys=user_ids)

               att_1     att_2
12 Category 1      1  whatever
   Category 2     23   another
15 Category 1     10       foo
   Category 2     30       bar

Answer 1

pandas MultiIndex はタプルのリストで構成されています。したがって、最も自然なアプローチは、入力辞書のキーが必要なマルチインデックス値に対応するタプルになるように再形成することです。その後、pd.DataFrame.from_dictオプションを使用して、データフレームを構築できますorient='index'。

user_dict = {12: {'Category 1': {'att_1': 1, 'att_2': 'whatever'},
                  'Category 2': {'att_1': 23, 'att_2': 'another'}},
             15: {'Category 1': {'att_1': 10, 'att_2': 'foo'},
                  'Category 2': {'att_1': 30, 'att_2': 'bar'}}}

pd.DataFrame.from_dict({(i,j): user_dict[i][j] 
                           for i in user_dict.keys() 
                           for j in user_dict[i].keys()},
                       orient='index')


               att_1     att_2
12 Category 1      1  whatever
   Category 2     23   another
15 Category 1     10       foo
   Category 2     30       bar

別の方法としては、コンポーネントデータフレームを連結してデータフレームを構築する方法があります。

user_ids = []
frames = []

for user_id, d in user_dict.iteritems():
    user_ids.append(user_id)
    frames.append(pd.DataFrame.from_dict(d, orient='index'))

pd.concat(frames, keys=user_ids)

               att_1     att_2
12 Category 1      1  whatever
   Category 2     23   another
15 Category 1     10       foo
   Category 2     30       bar

ネストされた辞書の項目からパンダの DataFrame を構築する質問する

ベストアンサー1

おすすめ記事