未知长度数组，随时分配数组的任何部分

Question

我正在使用 Q-Learning 并想要一个完全空的 3D 策略梯度，直到 AI 需要访问它。
这是因为我的状态是三个输入，每个输入可以是从 1 到无穷大的任何整数，每个大于 1 的数字的可能性越来越小。

希望这是可能的。我也不是在寻找交给我的代码，只是希望有人能指出正确的方向。

policyGradient = [][][]
policyGradient[5][10][15] = 0.5
print(policyGradient[5][10][15]) // Expected output being 0.5.

谢谢！

Answer 1

你可以使用一个字典的字典，但是如果你不需要索引任何特定的状态输入，你可以只使用一个带有键元组的字典：

gradient = dict()

gradient[5,10,15] = 0.5

Answer 2

有点老套

import collections
magic = lambda:collections.defaultdict(magic)
dd = magic()
dd[5] = 6
dd[6][7][7]=67
print(dd[6][7][7])

Unknown Length Array, Assigning Any Part Of The Array Any Time