矢量双双浮点运算
Vector double-double floating point arithmetic
存在双精度浮点不能充分满足的工作负载,因此需要四精度。这在硬件中很少提供,因此解决方法是使用 double-double,其中 128 位数字由一对 64 位数字表示。这不是真正的 IEEE-754 四精度 - 一方面你没有得到任何额外的指数位 - 但对于许多用途来说足够接近,并且比纯软件实现快得多。
许多计算机都提供向量浮点运算,希望将它们用于双双运算。这可能吗?特别是,在 https://github.com/JuliaMath/DoubleDouble.jl/blob/master/src/DoubleDouble.jl 处查看 double-double 的实现,在我看来,每个算术运算在中间至少需要一个条件分支,我认为这意味着不能使用 SIMD 向量运算,除非我遗漏了什么东西?
我猜你在想加减法的实现,例如:
# Dekker add2
function +{T}(x::Double{T}, y::Double{T})
r = x.hi + y.hi
s = abs(x.hi) > abs(y.hi) ? (((x.hi - r) + y.hi) + y.lo) + x.lo : (((y.hi - r) + x.hi) + x.lo) + y.lo
Double(r, s)
end
在某些体系结构上,解决方案可能是使用 SIMD 指令并行计算两个分支,然后执行一个操作来检索两个分支的正确结果。例如,从错误的操作数中减去 x.hi + y.hi
产生的不正确结果可能总是带有负号,因此取最大值可能总是提取正确的结果。 (晚上这个时候,我不保证这在这种情况下有效,但对于某些操作,一般的做法是。)
另一个可能是比较向量 {x.hi, y.hi} > {y.hi, x.hi}
以形成位掩码。 (那是伪代码,不是 Julia 语法。)位掩码和一对潜在结果的按位与将保持正确结果不变,并将不正确结果的所有位设置为零。然后,使用按位或减少屏蔽向量会产生正确的结果。不需要分支。
给定的 ISA 可能有其他有用的技巧,例如条件指令。或者还有其他算法而不是 Dekker 的算法。
存在双精度浮点不能充分满足的工作负载,因此需要四精度。这在硬件中很少提供,因此解决方法是使用 double-double,其中 128 位数字由一对 64 位数字表示。这不是真正的 IEEE-754 四精度 - 一方面你没有得到任何额外的指数位 - 但对于许多用途来说足够接近,并且比纯软件实现快得多。
许多计算机都提供向量浮点运算,希望将它们用于双双运算。这可能吗?特别是,在 https://github.com/JuliaMath/DoubleDouble.jl/blob/master/src/DoubleDouble.jl 处查看 double-double 的实现,在我看来,每个算术运算在中间至少需要一个条件分支,我认为这意味着不能使用 SIMD 向量运算,除非我遗漏了什么东西?
我猜你在想加减法的实现,例如:
# Dekker add2
function +{T}(x::Double{T}, y::Double{T})
r = x.hi + y.hi
s = abs(x.hi) > abs(y.hi) ? (((x.hi - r) + y.hi) + y.lo) + x.lo : (((y.hi - r) + x.hi) + x.lo) + y.lo
Double(r, s)
end
在某些体系结构上,解决方案可能是使用 SIMD 指令并行计算两个分支,然后执行一个操作来检索两个分支的正确结果。例如,从错误的操作数中减去 x.hi + y.hi
产生的不正确结果可能总是带有负号,因此取最大值可能总是提取正确的结果。 (晚上这个时候,我不保证这在这种情况下有效,但对于某些操作,一般的做法是。)
另一个可能是比较向量 {x.hi, y.hi} > {y.hi, x.hi}
以形成位掩码。 (那是伪代码,不是 Julia 语法。)位掩码和一对潜在结果的按位与将保持正确结果不变,并将不正确结果的所有位设置为零。然后,使用按位或减少屏蔽向量会产生正确的结果。不需要分支。
给定的 ISA 可能有其他有用的技巧,例如条件指令。或者还有其他算法而不是 Dekker 的算法。