std::string 移动构造函数真的移动了吗?
Does std::string move constructor actually move?
所以我得到了一个小测试程序:
#include <string>
#include <iostream>
#include <memory>
#include <vector>
class Test
{
public:
Test(const std::vector<int>& a_, const std::string& b_)
: a(std::move(a_)),
b(std::move(b_)),
vBufAddr(reinterpret_cast<long long>(a.data())),
sBufAddr(reinterpret_cast<long long>(b.data()))
{}
Test(Test&& mv)
: a(std::move(mv.a)),
b(std::move(mv.b)),
vBufAddr(reinterpret_cast<long long>(a.data())),
sBufAddr(reinterpret_cast<long long>(b.data()))
{}
bool operator==(const Test& cmp)
{
if (vBufAddr != cmp.vBufAddr) {
std::cout << "Vector buffers differ: " << std::endl
<< "Ours: " << std::hex << vBufAddr << std::endl
<< "Theirs: " << cmp.vBufAddr << std::endl;
return false;
}
if (sBufAddr != cmp.sBufAddr) {
std::cout << "String buffers differ: " << std::endl
<< "Ours: " << std::hex << sBufAddr << std::endl
<< "Theirs: " << cmp.sBufAddr << std::endl;
return false;
}
}
private:
std::vector<int> a;
std::string b;
long long vBufAddr;
long long sBufAddr;
};
int main()
{
Test obj1 { {0x01, 0x02, 0x03, 0x04}, {0x01, 0x02, 0x03, 0x04}};
Test obj2(std::move(obj1));
obj1 == obj2;
return 0;
}
我用来测试的软件:
Compiler: gcc 7.3.0
Compiler flags: -std=c++11
OS: Linux Mint 19 (tara) with upstream release Ubuntu 18.04 LTS (bionic)
我在这里看到的结果是,在移动之后,向量缓冲区仍然具有相同的地址,但字符串缓冲区没有。所以在我看来,它分配了新的一个,而不是仅仅交换缓冲区指针。是什么导致了这种行为?
您可能会看到 small/short string optimization 的效果。为了避免为每个微小的小字符串进行不必要的分配,std::string
的许多实现包括一个固定大小的小数组来保存小字符串而不需要 new
当没有使用动态分配时是必要的,所以它消耗很少或没有额外的内存来提供它,无论是小的还是大的 string
s),并且这些字符串不会从 std::move
中受益(但它们很小,所以很好)。较大的字符串将需要动态分配,并会按照您的预期传输指针。
只是为了演示,这段代码在 g++
:
void move_test(std::string&& s) {
std::string s2 = std::move(s);
std::cout << "; After move: " << std::hex << reinterpret_cast<uintptr_t>(s2.data()) << std::endl;
}
int main()
{
std::string sbase;
for (size_t len=0; len < 32; ++len) {
std::string s1 = sbase;
std::cout << "Length " << len << " - Before move: " << std::hex << reinterpret_cast<uintptr_t>(s1.data());
move_test(std::move(s1));
sbase += 'a';
}
}
产生高(堆栈)地址,这些地址在长度为 15 或更短的移动构造中发生变化(可能随体系结构指针大小而变化),但是一旦达到长度 16,就会切换到移动构造后保持不变的低(堆)地址或更高(开关在 16,而不是 17,因为它是 NUL
- 终止字符串,因为 C++11 和更高版本需要它)。
要 100% 清楚:这是一个实现细节。 C++ 规范的任何部分 都不需要 这种行为,所以你根本不应该依赖它发生,当它发生时,你不应该依赖它发生在特定的字符串长度上。
所以我得到了一个小测试程序:
#include <string>
#include <iostream>
#include <memory>
#include <vector>
class Test
{
public:
Test(const std::vector<int>& a_, const std::string& b_)
: a(std::move(a_)),
b(std::move(b_)),
vBufAddr(reinterpret_cast<long long>(a.data())),
sBufAddr(reinterpret_cast<long long>(b.data()))
{}
Test(Test&& mv)
: a(std::move(mv.a)),
b(std::move(mv.b)),
vBufAddr(reinterpret_cast<long long>(a.data())),
sBufAddr(reinterpret_cast<long long>(b.data()))
{}
bool operator==(const Test& cmp)
{
if (vBufAddr != cmp.vBufAddr) {
std::cout << "Vector buffers differ: " << std::endl
<< "Ours: " << std::hex << vBufAddr << std::endl
<< "Theirs: " << cmp.vBufAddr << std::endl;
return false;
}
if (sBufAddr != cmp.sBufAddr) {
std::cout << "String buffers differ: " << std::endl
<< "Ours: " << std::hex << sBufAddr << std::endl
<< "Theirs: " << cmp.sBufAddr << std::endl;
return false;
}
}
private:
std::vector<int> a;
std::string b;
long long vBufAddr;
long long sBufAddr;
};
int main()
{
Test obj1 { {0x01, 0x02, 0x03, 0x04}, {0x01, 0x02, 0x03, 0x04}};
Test obj2(std::move(obj1));
obj1 == obj2;
return 0;
}
我用来测试的软件:
Compiler: gcc 7.3.0
Compiler flags: -std=c++11
OS: Linux Mint 19 (tara) with upstream release Ubuntu 18.04 LTS (bionic)
我在这里看到的结果是,在移动之后,向量缓冲区仍然具有相同的地址,但字符串缓冲区没有。所以在我看来,它分配了新的一个,而不是仅仅交换缓冲区指针。是什么导致了这种行为?
您可能会看到 small/short string optimization 的效果。为了避免为每个微小的小字符串进行不必要的分配,std::string
的许多实现包括一个固定大小的小数组来保存小字符串而不需要 new
当没有使用动态分配时是必要的,所以它消耗很少或没有额外的内存来提供它,无论是小的还是大的 string
s),并且这些字符串不会从 std::move
中受益(但它们很小,所以很好)。较大的字符串将需要动态分配,并会按照您的预期传输指针。
只是为了演示,这段代码在 g++
:
void move_test(std::string&& s) {
std::string s2 = std::move(s);
std::cout << "; After move: " << std::hex << reinterpret_cast<uintptr_t>(s2.data()) << std::endl;
}
int main()
{
std::string sbase;
for (size_t len=0; len < 32; ++len) {
std::string s1 = sbase;
std::cout << "Length " << len << " - Before move: " << std::hex << reinterpret_cast<uintptr_t>(s1.data());
move_test(std::move(s1));
sbase += 'a';
}
}
产生高(堆栈)地址,这些地址在长度为 15 或更短的移动构造中发生变化(可能随体系结构指针大小而变化),但是一旦达到长度 16,就会切换到移动构造后保持不变的低(堆)地址或更高(开关在 16,而不是 17,因为它是 NUL
- 终止字符串,因为 C++11 和更高版本需要它)。
要 100% 清楚:这是一个实现细节。 C++ 规范的任何部分 都不需要 这种行为,所以你根本不应该依赖它发生,当它发生时,你不应该依赖它发生在特定的字符串长度上。