一次读取特定数量位的 PTX 命令

PTX command for reading specific amount of bit at a time

我知道这可以通过使用带有位操作函数的循环来实现,但是我想知道是否有更快更直接的方法来实现。我使用大约 64 位作为我的数据结构的 header,这可能有很多不同的东西。线程对 header 进行解码,然后分配正确的结构以对该数据结构进行操作。但是现在我正在使用位操作函数来读取和写入 header 这不太理想,我阅读了 cuda 和 ptx 文档并且没有找到任何可以帮助我的东西。我想知道我是否确实遗漏了任何一个,或者实际上有 none 专门用于一次读取一位的特定函数。

你没有找到你要找的东西,因为它不存在。

仅 PTX supports 8、16、32 和 64 位类型的内存事务,或相同基本类型的 2 或 4 个元素向量。没有关于从内存中的任意字加载或存储单个位的说明。