Numpy:np.abs 实际上是如何工作的?

Numpy: How does np.abs actually work under the hood?

我正在尝试在 Go 中为 gonum 密集向量实现我自己的绝对函数。我在想是否有比先平方再平方根更好的方法来获取数组的绝对值?


NumPy 源代码可能很难浏览,因为它具有适用于多种数据类型的多种功能。您可以在文件 scalarmath.c.src 中找到绝对值函数的 C 级源代码。该文件实际上是一个带有函数定义的模板,构建系统稍后会为多种数据类型复制这些函数定义。请注意,每个函数都是 "kernel",即数组的每个元素的 运行(循环遍历数组是在其他地方完成的)。这些函数总是称为 <name of the type>_ctype_absolute,其中 <name of the type> 是它适用的数据类型,通常是模板化的。让我们来看看它们。

/**begin repeat
 * #name = ubyte, ushort, uint, ulong, ulonglong#

#define @name@_ctype_absolute @name@_ctype_positive

/**end repeat**/

这个是针对无符号类型的。在这种情况下,绝对值与 np.positive 相同,它只是复制值而不做任何事情(如果你有一个数组 a 并且你做 +a,这就是你得到的) .

/**begin repeat
 * #name = byte, short, int, long, longlong#
 * #type = npy_byte, npy_short, npy_int, npy_long, npy_longlong#
static void
@name@_ctype_absolute(@type@ a, @type@ *out)
    *out = (a < 0 ? -a : a);
/**end repeat**/


/**begin repeat
 * #name = float, double, longdouble#
 * #type = npy_float, npy_double, npy_longdouble#
 * #c = f,,l#
static void
@name@_ctype_absolute(@type@ a, @type@ *out)
    *out = npy_fabs@c@(a);
/**end repeat**/

这是针对浮点值的。这里使用了 npy_fabsfnpy_fabsnpy_fabsl 函数。这些在 npy_math.h, but defined through templated C code in npy_math_internal.h.src, essentially calling the C/C99 counterparts (unless C99 is not available, in which case fabsf and fabsl are emulated with fabs) 中声明。您可能认为前面的代码应该也适用于浮点类型,但实际上这些更复杂,因为它们有 NaN、无穷大或带符号的零之类的东西,所以最好使用处理所有问题的标准 C 函数可靠。

static void
half_ctype_absolute(npy_half a, npy_half *out)
    *out = a&0x7fffu;

这个其实不是模板化的,是half-precision floating-point values的绝对值函数。原来你可以通过按位运算(将第一位设置为 0)来更改符号,因为半精度比其他浮点类型更简单(如果更有限)(对于那些通常是相同的,但有特殊情况).

/**begin repeat
 * #name = cfloat, cdouble, clongdouble#
 * #type = npy_cfloat, npy_cdouble, npy_clongdouble#
 * #rtype = npy_float, npy_double, npy_longdouble#
 * #c = f,,l#
static void
@name@_ctype_absolute(@type@ a, @rtype@ *out)
    *out = npy_cabs@c@(a);
/**end repeat**/

最后一个是针对复杂类型的。这些使用 npy_cabsfnpycabsnpy_cabsl 函数,再次在 npy_math.h but in this case template-implemented in npy_math_complex.c.src using C99 functions (unless that is not available, in which case it is emulated with np.hypot).
