首页
标签

intrinsics

如何水平添加 AVX2 矢量 3 x 3？
为什么我的 AVX2 水平加法函数没有比非 SIMD 加法快？
将 SIMD 寄存器中的 64 位整数解释为 32 位整数的问题
_mm_prefetch 是如何工作的？
使用 SSE 将 8 位整数除以 4（或移位）
VS：_BitScanReverse64 内在的意外优化行为
如何使用 SSE 高效地执行 int8/int64 转换？
如何在 AVX/AVX2 中递增向量
_mm256_shuffle_ps 是如何工作的？
测试 NEON SIMD 寄存器在所有通道上的相等性
包装内在函数的简单 C++ 表达式模板会产生不同的指令
GNU __builtin_ia32 函数（对于 Visual Studio 编译器）是否有等价物？
按 1 个位置打乱 AVX 256 向量元素 left/right - C 内在函数
如何混合 32 位整数？或者：为什么没有_mm256_blendv_epi32？
GNU C 原生向量：如何广播标量，如 x86 的 _mm_set1_epi16
gcc (6.1.0) 在 SSE 内在函数中使用 'wrong' 指令
使用结果浮点数时出现 SSE SIMD 分段错误
SSE 内在函数检查零标志
用于灰度到 ARGB 转换的 C++ SSE2 或 AVX2 内在函数
是否有相当于 _mm_slli_si128(__m128i a, int num) 的浮点数？

1 2 ... 17 18 19 ... 25 26

©2023 WhoseBug