如何正确调用 aligned new/delete?

How to invoke aligned new/delete properly?

如何调用带对齐的 new 运算符?

auto foo = new(std::align_val_t(32)) Foo; //?

然后,如何正确删除它?

delete(std::align_val_t(32), foo); //?

如果这是使用这些重载的正确形式,为什么 valgring 抱怨不匹配的 free()/delete/delete[]?

存在非常基本的原则 - 内存释放例程总是必须匹配分配例程。如果我们使用不匹配的分配和释放 - 运行 时间行为可以是任何:都可以是随机的,或者在 运行 时间崩溃,或者内存泄漏,或者堆损坏。

如果我们使用 operator new 的对齐版本分配内存

void* operator new  ( std::size_t count, std::align_val_t al);

我们必须使用相应的对齐版本的operator delete

void operator delete  ( void* ptr, std::align_val_t al );

在这里调用void operator delete ( void* ptr );总是会导致运行-时间错误。简单测试一下

    std::align_val_t al = (std::align_val_t)256;
    if (void* pv = operator new(8, al))
    {
        operator delete(pv, al);
        //operator delete(pv); this line crash, or silently corrupt heap
    }

为什么 operator delete 的对齐和不对齐版本总是不兼容?让我们想想 - 怎么可能在一些值内存上分配 align ?我们最初总是分配一些内存块。对于要使用的 return align 指针 - 我们需要将分配的内存指针调整为多重对齐。行。这可以通过分配比请求更多的内存并调整指针来实现。但现在问题 - 这个街区有多自由?一般来说,用户得到的指针不指向分配内存的开头——如何从这个用户指针跳回到分配块的开头?没有其他信息,这是不可能的。我们需要在用户 returned 指针之前存储指向实际分配内存的指针。可能这在对齐 newdelete 使用 _aligned_malloc and _aligned_free

的代码典型实现中会更加明显
void* operator new(size_t size, std::align_val_t al)
{
    return _aligned_malloc(size, static_cast<size_t>(al));
}

void operator delete  (void * p, std::align_val_t al)
{
    _aligned_free(p);
}

未对齐时 newdelete 使用 mallocfree

void* operator new(size_t size)
{
    return malloc(size);
}

void operator delete  (void * p)
{
    free(p);
}

现在让我们寻找 _aligned_malloc and _aligned_free

的内部实现
void* __cdecl _aligned_malloc(size_t size, size_t alignment)
{
    if (!alignment || ((alignment - 1) & alignment))
    {
        // alignment is not a power of 2 or is zero
        return 0;
    }

    union {
        void* pv;
        void** ppv;
        uintptr_t up;
    };

    if (void* buf = malloc(size + sizeof(void*) + --alignment))
    {
        pv = buf;
        up = (up + sizeof(void*) + alignment) & ~alignment;
        ppv[-1] = buf;

        return pv;
    }

    return 0;
}

void __cdecl _aligned_free(void * pv)
{
    if (pv)
    {
        free(((void**)pv)[-1]);
    }
}

一般来说 _aligned_malloc 分配 size + sizeof(void*) + alignment - 1 而不是调用者 size 请求。调整分配的指针以适应对齐方式,并且 store 最初分配的内存是在指针 returned 之前分配给调用者的。

_aligned_free(pv) 调用的不是 free(pv) 而是 free(((void**)pv)[-1]); - 因为 总是另一个 指针。因为 _aligned_free(pv) 的这种效果总是另一个比较 free(pv)。并且 operator delete(pv, al); 始终与 operator delete(pv); 不兼容,如果说 delete [] 通常与 delete 具有相同的效果,但对齐与不对齐总是 运行 时间不同。

下面的语法是唯一对我有用的创建和销毁过度对齐数组的语法,使用 clang-cl 13 on Windows 10 x64:

int* arr = new (std::align_val_t(64)) int[555];
::operator delete[] (arr, std::align_val_t(64));

对于相同的新操作,下面的删除表达式将无法编译(“无法删除 'std::align_val_t' 类型的表达式):

delete[] (arr, std::align_val_t(64));

下面的删除表达式将编译,但会抛出运行时错误(“ 检测到严重错误 c0000374"):

delete[](std::align_val_t(64), blocks);