首页
标签

avx

ObjectiveAVX指令中寄存器和指针的区别
使用 __builtin_popcount 或其他内在函数来处理 _mm256_movemask_pd 比较位图的结果？
为什么 gcc 不将 _mm256_loadu_pd 解析为单个 vmovupd？
在 AVX 向量中加载 64 位整数
SSE/AVX：根据每个元素的最小和最大绝对值从两个 __m256 浮点向量中选择
如何将 %rax 中的双精度移动到 %ymm 或 %zmm 上的特定 qword 位置？（卡比湖或更高版本）
有效使用英特尔编译器 SVML `__m128 _mm_sincos_ps ()`
对齐与未对齐 x86 SIMD 指令之间的选择
如何从 __m64 值的 lsb 创建一个 8 位掩码？
在 VS 2017 中编写流水线优化的 C AVX 代码
xmm 寄存器的 vbroadcastsd 等价物是什么？
AVX计算精度
如何根据另一个包含 0 或 1 个元素的向量有条件地否定 AVX2 int16_t 向量？
使用 SIMD 右移 32 位压缩负数
在 AVX2 中重现 _mm256_sllv_epi16 和 _mm256_sllv_epi8
shuffle/permute 内在函数如何为 256 位 pd 工作？
性能报告显示此函数“__memset_avx2_unaligned_erms”有开销。这是否意味着内存未对齐？
有没有办法用 AVX2 编写 _mm256_shldi_epi8(a,b,1)？（向量之间每 8 位元素移动一位）
在运行时从 simd 寄存器获取任意浮点数？
计算八个 AVX 单精度浮点向量的 8 个水平和

1 2 ... 11 12 13 ... 24 25

©2023 WhoseBug