pybind11 return numpy 对象数组

pybind11 return numpy array of objects

使用 pybind11 C++ API 和 python3,我们如何在 C++ 实现中正确创建对象的 numpy 数组(即 unicode 字符串)并 return 返回 python?传入 pybind11::array() 的底层数据数组的确切内存布局是什么?我们究竟需要如何管理内存,即 delete/free?

请注意,这是必要的,因为我们要在 pandas DataFrame 创建中使用该字符串数组以及其他 POD 数组。

事实证明有必要:

  1. 创建一个PyObject指针数组,填充数组,即

    auto* pbuf = new PyObject*[arraySize]; // or create via pybind11 API...
    pbuf[0] = <new object...>
    pbuf[1] = <new object...>
    etc.
    
  2. 创建一个带有胶囊的 "object" py::array():

    py::capsule freeWhenDone(pbuf, [](void* pp) {
            delete [] (PyObject*)pp; // or else properly free the pbuf memory
        });
    
    arr = py::array(py::dtype("object"),
        shape, strides, pbuf, freeWhenDone);