使用 SSE 将 8 位整数除以 4(或移位)
Divide 8-bit integers by 4 (or shift) using SSE
如何使用 SSE 内在函数将 16 个 8 位整数除以 4(或将它们向右移动 2)?
不幸的是,没有针对 8 位元素的 SSE 移位指令。如果元素是 8 位 unsigned 那么您可以使用 16 位移位并屏蔽掉不需要的高位,例如
v = _mm_srli_epi16(v, 2);
v = _mm_and_si128(v, _mm_set1_epi8(0x3f));
对于 8 位 signed 元素,它有点复杂,但仍然可能,尽管解压缩到 16 位可能更容易,进行移位,然后打包回 8位。
如何使用 SSE 内在函数将 16 个 8 位整数除以 4(或将它们向右移动 2)?
不幸的是,没有针对 8 位元素的 SSE 移位指令。如果元素是 8 位 unsigned 那么您可以使用 16 位移位并屏蔽掉不需要的高位,例如
v = _mm_srli_epi16(v, 2);
v = _mm_and_si128(v, _mm_set1_epi8(0x3f));
对于 8 位 signed 元素,它有点复杂,但仍然可能,尽管解压缩到 16 位可能更容易,进行移位,然后打包回 8位。