既存のデータフレームに新しい列を追加する方法質問する

Question

2017年編集

コメントや@Alexanderが指摘しているように、現在、Seriesの値をDataFrameの新しい列として追加する最良の方法は、assign:

df1 = df1.assign(e=pd.Series(np.random.randn(sLength)).values)

編集 2015このコードで
問題が発生したという報告がいくつかありました。ただし、このコードは現在の pandas バージョン 0.16.1 でも完全に動作します。SettingWithCopyWarning

>>> sLength = len(df1['a'])
>>> df1
          a         b         c         d
6 -0.269221 -0.026476  0.997517  1.294385
8  0.917438  0.847941  0.034235 -0.448948

>>> df1['e'] = pd.Series(np.random.randn(sLength), index=df1.index)
>>> df1
          a         b         c         d         e
6 -0.269221 -0.026476  0.997517  1.294385  1.757167
8  0.917438  0.847941  0.034235 -0.448948  2.228131

>>> pd.version.short_version
'0.16.1'

SettingWithCopyWarningこれは、データフレームのコピーに無効な割り当てがある可能性があることを通知することを目的としています。必ずしも間違ったことを言っているわけではありませんが（誤検知を引き起こす可能性があります）、0.13.0からは、同じ目的に適した方法があることを知らせてくれます。警告が表示されたら、そのアドバイスに従ってください。代わりに.loc[row_index,col_indexer] = valueを使用してください。

>>> df1.loc[:,'f'] = pd.Series(np.random.randn(sLength), index=df1.index)
>>> df1
          a         b         c         d         e         f
6 -0.269221 -0.026476  0.997517  1.294385  1.757167 -0.050927
8  0.917438  0.847941  0.034235 -0.448948  2.228131  0.006109
>>>

実際、これは現在、より効率的な方法である。pandasのドキュメントに記載

元の回答:

元の df1 インデックスを使用してシリーズを作成します。

df1['e'] = pd.Series(np.random.randn(sLength), index=df1.index)

Answer 1