sse2 指令集未启用

Question

CC=g++
CFLAGS=-O3 -c -Wall
DFLAGS=-g -Wall
LDFLAGS= -lz -lm -lpthread

KSWSOURCE=ksw.c
ALGNSOURCES=main.cpp aligner.cpp graph.cpp  readfl.cpp hash.cpp form.cpp btree.cpp conLSH.cpp
INDSOURCES=whash.cpp genhash.cpp formh.cpp conLSH.cpp

INDOBJECTS=$(INDSOURCES:.cpp=.o) $(KSWSOURCE:.c=.o)
ALGNOBJECTS=$(ALGNSOURCES:.cpp=.o) $(KSWSOURCE:.c=.o)

INDEXER=conLSH-indexer
ALIGNER=conLSH-aligner

all: $(INDSOURCES) $(ALGNSOURCES) $(KSWSOURCE) $(ALIGNER) $(INDEXER)

$(ALIGNER): $(ALGNOBJECTS)
        $(CC)  $(ALGNOBJECTS) -o $@ $(LDFLAGS)

$(INDEXER): $(INDOBJECTS)
        $(CC)  $(INDOBJECTS) readfl.o -o $@ $(LDFLAGS)

debug:
        $(CC) $(DFLAGS) $(ALGNSOURCES) $(KSWSOURCE) $(LDFLAGS)

.cpp.o:
        $(CC) $(CFLAGS) $< -o $@
.c.o:
        $(CC) $(CFLAGS) $< -o $@
clean:
        rm -rf *.o $(ALIGNER) $(INDEXER) a.out

我有上面的 makefile，但出现错误

/usr/lib/gcc/i686-linux-gnu/4.8/include/emmintrin.h:31:3: error: #error "SSE2 instruction set not enabled"
 # error "SSE2 instruction set not enabled"

根据我的理解和谷歌搜索，这是并行计算的标志。

我尝试从其他有同样问题的帖子中包括：

CXXFLAGS=-03 -c Wall -mfpmath=sse

或：

set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -msse -msse2 -msse3")

但没有任何成功。你能帮忙吗？

我不确定是否需要 CXX 标志，因为 ksw 中显示了很多（可能）级联错误，例如，

ksw.c:49:2: error: ‘__m128i’ does not name a type
  __m128i *qp, *H0, *H1, *E, *Hmax;

Answer 1

-msse2 是特定选项，因此如果您将构建脚本设置为实际执行此操作，则将其传递给 GCC 即可。 https://gcc.gnu.org/onlinedocs/gcc/x86-Options.html#x86-Options

或者更好的是，使用 -march=native 来启用你的 CPU 所拥有的一切，如果你是为本地使用而构建的，而不是为了分发可能必须在旧的但 -不古老 CPU。（当然，如果你关心性能，为 32 位模式构建是很奇怪的。SSE2 是 x86-64 的基线。除非你的 CPU 太旧而不能支持 SSE2，例如 Pentium III。或者对于例如，有没有 SSE 的嵌入式 x86 CPUs，比如 AMD Geode。在这种情况下，使用 -msse2 构建（成功）的二进制文件可能会因非法指令而崩溃 CPU.)

-mfpmath=sse 只是告诉 GCC 在 SSE 可用的情况下将 SSE 用于标量 FP 数学；与告诉 GCC 假定目标 CPU 支持 SSE2 无关。使用它 也可以 提高性能，但对编译代码没有影响。

是的，像 __m128i 这样的 SSE1/2 内部类型只有在启用 SSE 时才会被定义，所以 error: ‘__m128i’ does not name a type 是 -msse 未启用的明确标志

如果使用 autoconf 之类的，也许使用这个：

./configure CPPFLAGS="-O3 -march=native -fno-math-errno"

如果您有 .c 文件和 .cpp，请设置 CFLAGS 和 CPPFLAGS。更多选项如 -flto 可以帮助优化（在 link 时间跨文件内联），如果你将它们添加到你的 LD 选项中。以及任何其他优化选项，如 -ffast-math 如果你想使用它。或者至少 -fno-trapping-math 可以帮助一些，并且 GCC 已经进行了优化，这违反了 trapping-math 应该提供的语义。请参阅回复：-fno-trapping-math -fno-math-errno 基本上在任何地方都可以安全使用，即使在依赖严格 FP 的代码（如 Kahan 求和）中也是如此。

Answer 2

这对我也有用：

./configure CPPFLAGS="-march=native"

sse2 指令集未启用

sse2 instruction set not enabled

sse

g++