CUDA递归深度

CUDA recursion depth

CUDA中使用动态并行时,您可以实现mergeSort等递归算法。我已经实现了它,但我的程序不适用于大于 blah.
的输入 我的问题是递归树的实现可以达到多少深度?有什么限制吗? (我的程序适合较小的输入。)

来自专业CUDA C编程:

The maximum nesting depth of dynamic parallelism is limited to 24, but in reality most kernels will be limited by the amount of memory required by the device runtime system at each new level . . .