CUDA中是否有bitscan forward/reverse

Is there a bitscan forward/reverse in CUDA

我遇到了一些奇怪的情况,但我希望在 CUDA 中使用 BSF/BSR 指令。只是想知道是否有任何方法可以在 CUDA 中 运行 这条指令而不需要太多开销。

整型内在函数列表在 documentation 中可用。例如,您可以使用 __clz 内在函数来模仿 BSR。对于 BSF,我认为 __ffs 应该完成大部分工作。