使用带有小图案的 SSE4.2 指令 PCMPESTRM
Using SSE4.2 instruction PCMPESTRM with small patterns
我正在尝试在用 C++ 编码的字符串匹配算法中使用一些 SSE4.2 指令。
我不明白如何使用这些指令来匹配较小的模式,希望有人能帮我解决这个问题。
在代码示例中,我试图在压缩字符串 "i am an antelope" 中找到模式 "ant"。我希望结果是一个掩码设置为所有零,除了索引 8 处的 1。
现在这是我的代码,其中包含用于 nmmintrin.h 的#include 以包含 sse4.2 指令:
void print128_num(__m128i var)
{
uint8_t *val = (uint8_t*) &var;
printf("Text: %i %i %i %i %i %i %i %i %i %i %i %i %i %i %i %i \n",
val[0], val[1], val[2], val[3], val[4], val[5],
val[6], val[7], val[8], val[9], val[10], val[11],
val[12], val[13], val[14], val[15]);
}
int main(){
__m128i s = _mm_set_epi8('e','p','o','l','e','t','n','a',' ','n','a',' ','m','a',' ','i');
__m128i p = _mm_set_epi8(0,0,0,0,0,0,0,0,0,0,0,0,0,'t','n','a');
print128_num(s);
print128_num(p);
__m128i res = _mm_cmpestrm(s, 16, p, 3, 0);
print128_num(res);
return 0;
}
我添加了所有的零,因为初始化函数不允许更少的参数。我意识到这是错误的,但不知道该怎么做,做了几次非常绝望的尝试。
反正我是这样编译的:g++ -g sse4test.cpp -o sse4test -std=c++11 -msse4.2
这是我的输出:
Text: 105 32 97 109 32 97 110 32 97 110 116 101 108 111 112 101
Text: 97 110 116 0 0 0 0 0 0 0 0 0 0 0 0 0
Text: 7 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
我不明白,真的。 (最后一行)。
非常感谢任何帮助。
您的代码有两个问题。首先,在对 _mm_cmpestrm
的调用中,source 和 pattern 颠倒了。其次,您为最后一个参数指定 0
,这是一组指定操作模式的标志。
零模出现_SIDD_CMP_EQUAL_ANY
,描述为For each character c in A, determine whether any character in B is equal to c.
对于子字符串搜索,模式应指定为 _SIDD_UBYTE_OPS | _SIDD_CMP_EQUAL_ORDERED | _SIDD_BIT_MASK
。
如果您进行这些更改,输出为“0 1”,或者换句话说,匹配 9:th 字符。
顺便说一句:您可以使用 _mm_loadu_si128((__m128i*)(str));
而不是 _mm_set_epi8
.
从字符串加载
我正在尝试在用 C++ 编码的字符串匹配算法中使用一些 SSE4.2 指令。
我不明白如何使用这些指令来匹配较小的模式,希望有人能帮我解决这个问题。
在代码示例中,我试图在压缩字符串 "i am an antelope" 中找到模式 "ant"。我希望结果是一个掩码设置为所有零,除了索引 8 处的 1。
现在这是我的代码,其中包含用于 nmmintrin.h 的#include 以包含 sse4.2 指令:
void print128_num(__m128i var)
{
uint8_t *val = (uint8_t*) &var;
printf("Text: %i %i %i %i %i %i %i %i %i %i %i %i %i %i %i %i \n",
val[0], val[1], val[2], val[3], val[4], val[5],
val[6], val[7], val[8], val[9], val[10], val[11],
val[12], val[13], val[14], val[15]);
}
int main(){
__m128i s = _mm_set_epi8('e','p','o','l','e','t','n','a',' ','n','a',' ','m','a',' ','i');
__m128i p = _mm_set_epi8(0,0,0,0,0,0,0,0,0,0,0,0,0,'t','n','a');
print128_num(s);
print128_num(p);
__m128i res = _mm_cmpestrm(s, 16, p, 3, 0);
print128_num(res);
return 0;
}
我添加了所有的零,因为初始化函数不允许更少的参数。我意识到这是错误的,但不知道该怎么做,做了几次非常绝望的尝试。
反正我是这样编译的:g++ -g sse4test.cpp -o sse4test -std=c++11 -msse4.2
这是我的输出:
Text: 105 32 97 109 32 97 110 32 97 110 116 101 108 111 112 101
Text: 97 110 116 0 0 0 0 0 0 0 0 0 0 0 0 0
Text: 7 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
我不明白,真的。 (最后一行)。
非常感谢任何帮助。
您的代码有两个问题。首先,在对 _mm_cmpestrm
的调用中,source 和 pattern 颠倒了。其次,您为最后一个参数指定 0
,这是一组指定操作模式的标志。
零模出现_SIDD_CMP_EQUAL_ANY
,描述为For each character c in A, determine whether any character in B is equal to c.
对于子字符串搜索,模式应指定为 _SIDD_UBYTE_OPS | _SIDD_CMP_EQUAL_ORDERED | _SIDD_BIT_MASK
。
如果您进行这些更改,输出为“0 1”,或者换句话说,匹配 9:th 字符。
顺便说一句:您可以使用 _mm_loadu_si128((__m128i*)(str));
而不是 _mm_set_epi8
.