GCC 在为 Cascade-Lake 处理器编译时包含 AVX512 的 "Fused Multiply Add" 指令
GCC inclusion of AVX512's "Fused Multiply Add" instructions when compiling for Cascade-Lake processors
根据 gcc's documention,使用“-march=cascadelake”编译不会启用标志 -AVX512IFMA(如果我理解正确,它会启用对 AVX512 的 FMA 指令的支持)。相反,例如在使用“-march=cannonlake”和“-march=tigerlake”进行编译时包含此标志。
但是,根据英特尔的说法,Cascade-Lake 的处理器实际上每个都包含 2 个 AVX-512 FMA 单元(这是一个 example,据我所知,这对任何 Cascade-Lake 处理器都是如此) .
任何人都可以澄清这种行为吗?我是否误解了 AVX512IFMA 标志的含义?
SKX/CSX 上的 AVX-512 FMA 单元支持属于 AVX512F
扩展的 FMA 指令。这些指令对浮点操作数进行操作。 AVX512IFMA
指令对 52 位无符号整数操作数进行操作。它们是不同的指令集。维基百科在每个 AVX-512 扩展中都有 list 条说明。
根据 gcc's documention,使用“-march=cascadelake”编译不会启用标志 -AVX512IFMA(如果我理解正确,它会启用对 AVX512 的 FMA 指令的支持)。相反,例如在使用“-march=cannonlake”和“-march=tigerlake”进行编译时包含此标志。
但是,根据英特尔的说法,Cascade-Lake 的处理器实际上每个都包含 2 个 AVX-512 FMA 单元(这是一个 example,据我所知,这对任何 Cascade-Lake 处理器都是如此) .
任何人都可以澄清这种行为吗?我是否误解了 AVX512IFMA 标志的含义?
SKX/CSX 上的 AVX-512 FMA 单元支持属于 AVX512F
扩展的 FMA 指令。这些指令对浮点操作数进行操作。 AVX512IFMA
指令对 52 位无符号整数操作数进行操作。它们是不同的指令集。维基百科在每个 AVX-512 扩展中都有 list 条说明。