Power8 vsldoi 内置或替换

Power8 vsldoi built-in or replacement

我正在尝试使用内置函数将一些 ASM 代码移植到 C/C++ 中。 ASM code 有:

+  # Unpack a-h data from the packed vector to a vector register each
+  
+  vsldoi 10, 9, 9, 12
+  vsldoi 11, 9, 9, 8
+  vsldoi 12, 9, 9, 4

我找不到内置的 vec_vsldoi. When I search IBM's site I get 0 hits. I think vec_sldw 很接近,但它需要 3 个参数而不是 4 个。

我的第一个问题是,vec_vsldoi 有内置的吗?如果不是,我们是使用 vec_sldw 还是其他?

除了 XL C/C++,我们还支持 GCC 4.8。 GCC 似乎缺少这两个内在函数。我想我有替代品,但我有保留意见。一个测试程序显示 assembler 可以 assemble vsldoi.

// GCC 4.8 is missing vec_sldw and vec_vsldoi
#if defined(XLC_VERSION)
# define VEC_VSLDOI(a,b,c) vec_vsldoi(a,b,c)
#elif defined(GCC_VERSION)
# define VEC_VSLDOI(a,b,c) VEC_VSLDOI_TEMPLATE<c>(a,b)
template<unsigned int C>
uint8x16_p8 VEC_VSLDOI_TEMPLATE(uint8x16_p8 a, const uint8x16_p8& b)
{
    uint8x16_p8 r;
    __asm
    (
        "vsldoi %0, %1, %2, %3    \t\n"
        : "=v" (t) : "v" (a), "v" (b), "I" (C) : "cc"
    );
    return r;
}
#endif

我的第二个问题是,扩展的 GCC ASM 是否正确,或者我们应该做其他事情吗?

vec_sld是否满足您的需求? https://www.ibm.com/support/knowledgecenter/en/SSLTBW_2.2.0/com.ibm.zos.v2r2.cbcpx01/bif_vec_sld.htm(诚然不是 "POWER" 参考,但仍然相关)。

$ gcc --version
gcc (GCC) 4.8.5 20150623 (Red Hat 4.8.5-11)
Copyright (C) 2015 Free Software Foundation, Inc.
This is free software; see the source for copying conditions.  There is NO
warranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.

$ gcc -c vec_sld.c
$ objdump -d vec_sld.o | grep vsl
  4c:   2c 09 00 10     vsldoi  v0,v0,v1,4