valarray 就地操作给出不同的结果作为临时分配

valarray in-place operation gives different result as a temporary assignment

以下程序:

#include<iostream>
#include<valarray>

using namespace std;

int main() {
  int init[] = {1, 1};

  // Example 1
  valarray<int> a(init, 2);
  // In-place assignment
  a[slice(0, 2, 1)] = a[slice(0, 2, 1)] + valarray<int>(a[slice(0, 2, 1)]) * a[0];

  for (int k = 0; k < 2; ++ k) {
    cout << a[k] << ' ';  // Outputs 2 3
  }
  cout << endl;

  // Example 2
  valarray<int> b(init, 2);
  // Temporary assignment
  valarray<int> r = b[slice(0, 2, 1)] + valarray<int>(b[slice(0, 2, 1)]) * b[0];
  b[slice(0, 2, 1)] = r;

  for (int k = 0; k < 2; ++ k) {
    cout << b[k] << ' '; // Outputs 2 2
  }
  cout << endl;
  return 0;
}

输出:

2 3
2 2

正确答案是2 2<1 1> + <1 1> * 1 = <2 2>。为什么内联版本输出的东西不一样?

以防万一,我是这样编译的:

g++ myprogram.cpp -o myprogram

g++ -v的输出是:

Using built-in specs.
COLLECT_GCC=g++
COLLECT_LTO_WRAPPER=/usr/lib/gcc/x86_64-linux-gnu/5/lto-wrapper
Target: x86_64-linux-gnu
Configured with: ../src/configure -v --with-pkgversion='Ubuntu 5.4.0-6ubuntu1~16.04.5' --with-bugurl=file:///usr/share/doc/gcc-5/README.Bugs --enable-languages=c,ada,c++,java,go,d,fortran,objc,obj-c++ --prefix=/usr --program-suffix=-5 --enable-shared --enable-linker-build-id --libexecdir=/usr/lib --without-included-gettext --enable-threads=posix --libdir=/usr/lib --enable-nls --with-sysroot=/ --enable-clocale=gnu --enable-libstdcxx-debug --enable-libstdcxx-time=yes --with-default-libstdcxx-abi=new --enable-gnu-unique-object --disable-vtable-verify --enable-libmpx --enable-plugin --with-system-zlib --disable-browser-plugin --enable-java-awt=gtk --enable-gtk-cairo --with-java-home=/usr/lib/jvm/java-1.5.0-gcj-5-amd64/jre --enable-java-home --with-jvm-root-dir=/usr/lib/jvm/java-1.5.0-gcj-5-amd64 --with-jvm-jar-dir=/usr/lib/jvm-exports/java-1.5.0-gcj-5-amd64 --with-arch-directory=amd64 --with-ecj-jar=/usr/share/java/eclipse-ecj.jar --enable-objc-gc --enable-multiarch --disable-werror --with-arch-32=i686 --with-abi=m64 --with-multilib-list=m32,m64,mx32 --enable-multilib --with-tune=generic --enable-checking=release --build=x86_64-linux-gnu --host=x86_64-linux-gnu --target=x86_64-linux-gnu
Thread model: posix
gcc version 5.4.0 20160609 (Ubuntu 5.4.0-6ubuntu1~16.04.5) 

这看起来像是旧编译器缺少的模板重载。 Template

valarray<T>& operator=( valarray<T>&& other ) noexcept;

存在于 VS2017 和 gcc-7.1 but absent in older 版本中。右边的表达式似乎在每次迭代时都被评估和赋值。证明这一点的最简单示例:

#include <iostream>
#include <valarray>

int main() 
{

    std::valarray<int> a{2, 4, 8};
    a = a + a[0];

    for (auto n : a) 
        std::cout << n << " ";

    std::cout << std::endl << std::endl;

    return 0;
}

correct 输出是:

4 6 10

但是旧的编译器 produce

4 8 12

解决方案是使用更新的编译器或force copy

a = std::valarray<int>(a + a[0]);

希望对您有所帮助

首先,a[slice(0, 2, 1)] 的类型为 slice_array<T>operator+ 没有以 slice_array<T> 对象或引用作为参数的重载。

注意可能的工作重载 operator+(const valarray<T>&, const valarray<T>&) 是一个函数模板,虽然 slice_array<T> 可以隐式转换为 valarray<T>,但是模板参数 T 不能从slice_array<T> 参数。

所以严格来说,你的代码会导致编译错误。事实上,Clang does.


其次,你应该知道valarray的操作有一些优化技巧。一种众所周知的技术是 expression templates,它会导致您意想不到的结果。要了解它是如何工作的,让我们考虑一个重现此问题的更简单的示例:

valarray<int> a{1, 1};
a = a + a[0];
// now a is {2, 3} while {2, 2} is expected

表达式模板的关键思想是推迟表达式的计算,直到真正需要它的值,这样就避免了额外的临时。

在上面的示例中,优化器可能会选择将 a + a[0] 的结果优化为代理对象而不是 valarray<int> 临时对象。代理对象只是存储了"adding a[0] to a"的action(不是结果值)。

然后将代理对象分配给 a 时,将进行实际计算。从存储的操作中,优化器将为每个 i 选择将 a[i] + a[0] 分配给 a[i]。现在,此作业中的不同评估顺序将导致不同的结果。例如,如果编译器将a[0] + a[0]赋值给a[0],然后将a[1] + a[0](这里a[0]改为2)赋值给a[1],意想不到的结果{2, 3}产生了。

标准允许存在这样的代理对象,但似乎没有明确规定代理对象应该如何工作。我个人认为这是一个编译器错误,因为简单地评估 a[0] 并在分配之前存储它的值将解决这个问题,而性能损失很小。