引用存储在 Python 字典对象中的 pandas DataFrame 的特定列

Reference specific columns of a pandas DataFrame which is stored inside a Python dictionary object

我有一个包含 Pandas DataFrame 对象的 Python 字典,看起来像这样(如果这样更好的话,我可以很容易地将其更改为列表...):

 dict = 
 {'Thing 1': df
                      Actual      Error
 Date                                                        
 2014-09-15           140.00      140.000000
 2014-09-15           358.03      230.291656
 2014-09-16           373.04      46.367434
 2014-09-17           427.99      87.622059
 2014-09-18           484.87      94.364759

 ...

 'Thing 5': hf
                      Actual      Error
 Date
 2014-09-15           140.00      140.000000
 2014-09-15           358.03      230.291656
 2014-09-16           373.04      46.367434
 }

这使得我的密钥:'Thing 1'、'Thing 2'、...'Thing 5'(有时这些可能是非顺序的,如下所示:'Hello man'、'You''re nutty', 'Goodbye', '3', 'man'

我想对 dict 执行操作,以便 return "Actual" 列中所有值的新 dictionary/list。换句话说我想要:

 dict2 = 
 {'Thing 1': df
                      Actual
 Date                                                        
 2014-09-15           140.00
 2014-09-15           358.03
 2014-09-16           373.04
 2014-09-17           427.99
 2014-09-18           484.87

 ...

 'Thing 5': hf
                      Actual
 Date
 2014-09-15           140.00
 2014-09-15           358.03
 2014-09-16           373.04
 }

然后我想对生成的 dictionary/list 执行一些操作,例如:groupby(pandas.TimeGrouper..., cumsum() 等。我想避免 "for"不惜一切代价循环。我有一个使用 "for" 循环的解决方案,但它在计算上很昂贵。我尝试了很多解决方法,但不知道从哪里开始。我尝试过的任何方法都没有用。我我尝试了使用 items()、update() 和类似方法的多种变体。有什么想法吗...?没有 "for" 循环 and/or 快速执行会非常有帮助。

我找到了解决这个问题的两个方法。

1.) 使用PYDSE时,使用自动数据拟合的成本很高。别这样。

2.) 使用全新的计算机而不是 10 年以上的旧型号总是有帮助的。特别是当它满载时,15",MacPro 而不是预算购买 eMachines...

由于这两个发现,我从未正式解决过这个问题,但我认为我应该关闭这个问题。