首页
标签

sse

SSE 内联汇编和可能的 g++ 优化错误
双重否定的奇怪 SSE 汇编指令
为什么 mulss 在 Haswell 上只需要 3 个周期，与 Agner 的指令表不同？（展开具有多个累加器的 FP 循环）
SIMD 线性搜索比展开循环慢
我的向量化 xorshift+ 不是很随机
使先前的 NT 存储对其他线程中的后续内存加载可见
如何使用 Intel 内在函数重新排序 128 位向量？
SSE 的条件语句
SSE 和 iostream：浮点类型的错误输出
两个 SSE2 打包双打的最优无分支条件选择
MMX 和 XMM 寄存器之间的区别？
为什么SSE有128位加载函数？
严格别名、-ffast-math 和 SSE
128 位值 - 从 XMM 寄存器到通用
将 __m128i 值转换为 std::tuple
避免 AVX-SSE (VEX) 转换惩罚
AVX2 矢量化 256 位查找 table（32 个无符号字符）
PTEST 能否用于测试两个寄存器是否均为零或其他情况？
AVX2 float 比较并得到 0.0 或 1.0 而不是全 0 或全 1 位
pinsrd / _mm_insert_epi32 与字节指针对齐？

1 2 ... 16 17 18 ... 32 33

©2023 WhoseBug