CUDA中是否有bitscan forward/reverse
Is there a bitscan forward/reverse in CUDA
我遇到了一些奇怪的情况,但我希望在 CUDA 中使用 BSF/BSR 指令。只是想知道是否有任何方法可以在 CUDA 中 运行 这条指令而不需要太多开销。
整型内在函数列表在 documentation 中可用。例如,您可以使用 __clz
内在函数来模仿 BSR。对于 BSF,我认为 __ffs
应该完成大部分工作。
我遇到了一些奇怪的情况,但我希望在 CUDA 中使用 BSF/BSR 指令。只是想知道是否有任何方法可以在 CUDA 中 运行 这条指令而不需要太多开销。
整型内在函数列表在 documentation 中可用。例如,您可以使用 __clz
内在函数来模仿 BSR。对于 BSF,我认为 __ffs
应该完成大部分工作。