Numpy:np.abs 实际上是如何工作的?

Numpy: How does np.abs actually work under the hood?

我正在尝试在 Go 中为 gonum 密集向量实现我自己的绝对函数。我在想是否有比先平方再平方根更好的方法来获取数组的绝对值?

我的主要问题是我必须在这些向量上实现我自己的元素明智的牛顿平方根函数,并且在实现速度和准确性之间取得平衡。如果我能避免使用这个平方根函数,我会很高兴。

NumPy 源代码可能很难浏览,因为它具有适用于多种数据类型的多种功能。您可以在文件 scalarmath.c.src 中找到绝对值函数的 C 级源代码。该文件实际上是一个带有函数定义的模板,构建系统稍后会为多种数据类型复制这些函数定义。请注意,每个函数都是 "kernel",即数组的每个元素的 运行(循环遍历数组是在其他地方完成的)。这些函数总是称为 <name of the type>_ctype_absolute,其中 <name of the type> 是它适用的数据类型,通常是模板化的。让我们来看看它们。

/**begin repeat
 * #name = ubyte, ushort, uint, ulong, ulonglong#
 */

#define @name@_ctype_absolute @name@_ctype_positive

/**end repeat**/

这个是针对无符号类型的。在这种情况下,绝对值与 np.positive 相同,它只是复制值而不做任何事情(如果你有一个数组 a 并且你做 +a,这就是你得到的) .

/**begin repeat
 * #name = byte, short, int, long, longlong#
 * #type = npy_byte, npy_short, npy_int, npy_long, npy_longlong#
 */
static void
@name@_ctype_absolute(@type@ a, @type@ *out)
{
    *out = (a < 0 ? -a : a);
}
/**end repeat**/

这个用于有符号整数。非常简单。

/**begin repeat
 * #name = float, double, longdouble#
 * #type = npy_float, npy_double, npy_longdouble#
 * #c = f,,l#
 */
static void
@name@_ctype_absolute(@type@ a, @type@ *out)
{
    *out = npy_fabs@c@(a);
}
/**end repeat**/

这是针对浮点值的。这里使用了 npy_fabsfnpy_fabsnpy_fabsl 函数。这些在 npy_math.h, but defined through templated C code in npy_math_internal.h.src, essentially calling the C/C99 counterparts (unless C99 is not available, in which case fabsf and fabsl are emulated with fabs) 中声明。您可能认为前面的代码应该也适用于浮点类型,但实际上这些更复杂,因为它们有 NaN、无穷大或带符号的零之类的东西,所以最好使用处理所有问题的标准 C 函数可靠。

static void
half_ctype_absolute(npy_half a, npy_half *out)
{
    *out = a&0x7fffu;
}

这个其实不是模板化的,是half-precision floating-point values的绝对值函数。原来你可以通过按位运算(将第一位设置为 0)来更改符号,因为半精度比其他浮点类型更简单(如果更有限)(对于那些通常是相同的,但有特殊情况).

/**begin repeat
 * #name = cfloat, cdouble, clongdouble#
 * #type = npy_cfloat, npy_cdouble, npy_clongdouble#
 * #rtype = npy_float, npy_double, npy_longdouble#
 * #c = f,,l#
 */
static void
@name@_ctype_absolute(@type@ a, @rtype@ *out)
{
    *out = npy_cabs@c@(a);
}
/**end repeat**/

最后一个是针对复杂类型的。这些使用 npy_cabsfnpycabsnpy_cabsl 函数,再次在 npy_math.h but in this case template-implemented in npy_math_complex.c.src using C99 functions (unless that is not available, in which case it is emulated with np.hypot).

中声明