为什么 cudaOccupancyMaxActiveBlocksPerMultiprocessor() 独立于设备？

Why is cudaOccupancyMaxActiveBlocksPerMultiprocessor() independent of device?

不同的设备可能有不同的共享内存大小、寄存器数量。

为什么 cudaOccupancyMaxActiveBlocksPerMultiprocessor() 独立于设备？

不需要设备作为参数。

使用cudaSetDevice()设置的活动设备。