引用存储在 Python 字典对象中的 pandas DataFrame 的特定列
Reference specific columns of a pandas DataFrame which is stored inside a Python dictionary object
我有一个包含 Pandas DataFrame 对象的 Python 字典,看起来像这样(如果这样更好的话,我可以很容易地将其更改为列表...):
dict =
{'Thing 1': df
Actual Error
Date
2014-09-15 140.00 140.000000
2014-09-15 358.03 230.291656
2014-09-16 373.04 46.367434
2014-09-17 427.99 87.622059
2014-09-18 484.87 94.364759
...
'Thing 5': hf
Actual Error
Date
2014-09-15 140.00 140.000000
2014-09-15 358.03 230.291656
2014-09-16 373.04 46.367434
}
这使得我的密钥:'Thing 1'、'Thing 2'、...'Thing 5'(有时这些可能是非顺序的,如下所示:'Hello man'、'You''re nutty', 'Goodbye', '3', 'man'
我想对 dict 执行操作,以便 return "Actual" 列中所有值的新 dictionary/list。换句话说我想要:
dict2 =
{'Thing 1': df
Actual
Date
2014-09-15 140.00
2014-09-15 358.03
2014-09-16 373.04
2014-09-17 427.99
2014-09-18 484.87
...
'Thing 5': hf
Actual
Date
2014-09-15 140.00
2014-09-15 358.03
2014-09-16 373.04
}
然后我想对生成的 dictionary/list 执行一些操作,例如:groupby(pandas.TimeGrouper..., cumsum() 等。我想避免 "for"不惜一切代价循环。我有一个使用 "for" 循环的解决方案,但它在计算上很昂贵。我尝试了很多解决方法,但不知道从哪里开始。我尝试过的任何方法都没有用。我我尝试了使用 items()、update() 和类似方法的多种变体。有什么想法吗...?没有 "for" 循环 and/or 快速执行会非常有帮助。
我找到了解决这个问题的两个方法。
1.) 使用PYDSE时,使用自动数据拟合的成本很高。别这样。
2.) 使用全新的计算机而不是 10 年以上的旧型号总是有帮助的。特别是当它满载时,15",MacPro 而不是预算购买 eMachines...
由于这两个发现,我从未正式解决过这个问题,但我认为我应该关闭这个问题。
我有一个包含 Pandas DataFrame 对象的 Python 字典,看起来像这样(如果这样更好的话,我可以很容易地将其更改为列表...):
dict =
{'Thing 1': df
Actual Error
Date
2014-09-15 140.00 140.000000
2014-09-15 358.03 230.291656
2014-09-16 373.04 46.367434
2014-09-17 427.99 87.622059
2014-09-18 484.87 94.364759
...
'Thing 5': hf
Actual Error
Date
2014-09-15 140.00 140.000000
2014-09-15 358.03 230.291656
2014-09-16 373.04 46.367434
}
这使得我的密钥:'Thing 1'、'Thing 2'、...'Thing 5'(有时这些可能是非顺序的,如下所示:'Hello man'、'You''re nutty', 'Goodbye', '3', 'man'
我想对 dict 执行操作,以便 return "Actual" 列中所有值的新 dictionary/list。换句话说我想要:
dict2 =
{'Thing 1': df
Actual
Date
2014-09-15 140.00
2014-09-15 358.03
2014-09-16 373.04
2014-09-17 427.99
2014-09-18 484.87
...
'Thing 5': hf
Actual
Date
2014-09-15 140.00
2014-09-15 358.03
2014-09-16 373.04
}
然后我想对生成的 dictionary/list 执行一些操作,例如:groupby(pandas.TimeGrouper..., cumsum() 等。我想避免 "for"不惜一切代价循环。我有一个使用 "for" 循环的解决方案,但它在计算上很昂贵。我尝试了很多解决方法,但不知道从哪里开始。我尝试过的任何方法都没有用。我我尝试了使用 items()、update() 和类似方法的多种变体。有什么想法吗...?没有 "for" 循环 and/or 快速执行会非常有帮助。
我找到了解决这个问题的两个方法。
1.) 使用PYDSE时,使用自动数据拟合的成本很高。别这样。
2.) 使用全新的计算机而不是 10 年以上的旧型号总是有帮助的。特别是当它满载时,15",MacPro 而不是预算购买 eMachines...
由于这两个发现,我从未正式解决过这个问题,但我认为我应该关闭这个问题。