未知长度数组,随时分配数组的任何部分

Unknown Length Array, Assigning Any Part Of The Array Any Time

我正在使用 Q-Learning 并想要一个完全空的 3D 策略梯度,直到 AI 需要访问它。
这是因为我的状态是三个输入,每个输入可以是从 1 到无穷大的任何整数,每个大于 1 的数字的可能性越来越小。

希望这是可能的。我也不是在寻找交给我的代码,只是希望有人能指出正确的方向。

policyGradient = [][][]
policyGradient[5][10][15] = 0.5
print(policyGradient[5][10][15]) // Expected output being 0.5. 

谢谢!

你可以使用一个字典的字典,但是如果你不需要索引任何特定的状态输入,你可以只使用一个带有键元组的字典:

gradient = dict()

gradient[5,10,15] = 0.5

有点老套

import collections
magic = lambda:collections.defaultdict(magic)
dd = magic()
dd[5] = 6
dd[6][7][7]=67
print(dd[6][7][7])