std::string 移动构造函数真的移动了吗?

Does std::string move constructor actually move?

所以我得到了一个小测试程序:

#include <string>
#include <iostream>
#include <memory>
#include <vector>

class Test
{
public:
  Test(const std::vector<int>& a_, const std::string& b_)
    : a(std::move(a_)),
      b(std::move(b_)),
      vBufAddr(reinterpret_cast<long long>(a.data())),
      sBufAddr(reinterpret_cast<long long>(b.data()))
  {}

  Test(Test&& mv)
    : a(std::move(mv.a)),
      b(std::move(mv.b)),
      vBufAddr(reinterpret_cast<long long>(a.data())),
      sBufAddr(reinterpret_cast<long long>(b.data()))
  {}

  bool operator==(const Test& cmp)
  {
    if (vBufAddr != cmp.vBufAddr) {
      std::cout << "Vector buffers differ: " << std::endl
        << "Ours: " << std::hex << vBufAddr << std::endl
        << "Theirs: " << cmp.vBufAddr << std::endl;
      return false;
    }
    
    if (sBufAddr != cmp.sBufAddr) {
      std::cout << "String buffers differ: " << std::endl
        << "Ours: " << std::hex << sBufAddr << std::endl
        << "Theirs: " << cmp.sBufAddr << std::endl;
      return false;
    }
  }

private:
  
  std::vector<int> a;
  std::string b;
  long long vBufAddr;
  long long sBufAddr;
};

int main()
{
  Test obj1 { {0x01, 0x02, 0x03, 0x04}, {0x01, 0x02, 0x03, 0x04}};
  Test obj2(std::move(obj1));

  obj1 == obj2;
  
                       
  return 0;
}

我用来测试的软件:

Compiler: gcc 7.3.0

Compiler flags: -std=c++11

OS: Linux Mint 19 (tara) with upstream release Ubuntu 18.04 LTS (bionic)

我在这里看到的结果是,在移动之后,向量缓冲区仍然具有相同的地址,但字符串缓冲区没有。所以在我看来,它分配了新的一个,而不是仅仅交换缓冲区指针。是什么导致了这种行为?

您可能会看到 small/short string optimization 的效果。为了避免为每个微小的小字符串进行不必要的分配,std::string 的许多实现包括一个固定大小的小数组来保存小字符串而不需要 new当没有使用动态分配时是必要的,所以它消耗很少或没有额外的内存来提供它,无论是小的还是大的 strings),并且这些字符串不会从 std::move 中受益(但它们很小,所以很好)。较大的字符串将需要动态分配,并会按照您的预期传输指针。

只是为了演示,这段代码在 g++:

void move_test(std::string&& s) {
    std::string s2 = std::move(s);
    std::cout << "; After move: " << std::hex << reinterpret_cast<uintptr_t>(s2.data()) << std::endl;
}

int main()
{
    std::string sbase;

    for (size_t len=0; len < 32; ++len) {
        std::string s1 = sbase;
        std::cout << "Length " << len << " - Before move: " << std::hex << reinterpret_cast<uintptr_t>(s1.data());
        move_test(std::move(s1));
        sbase += 'a';
    }
}

Try it online!

产生高(堆栈)地址,这些地址在长度为 15 或更短的移动构造中发生变化(可能随体系结构指针大小而变化),但是一旦达到长度 16,就会切换到移动构造后保持不变的低(堆)地址或更高(开关在 16,而不是 17,因为它是 NUL- 终止字符串,因为 C++11 和更高版本需要它)。

要 100% 清楚:这是一个实现细节。 C++ 规范的任何部分 都不需要 这种行为,所以你根本不应该依赖它发生,当它发生时,你不应该依赖它发生在特定的字符串长度上。