随机访问不同大小的原始缓冲区数组？

Question

我有一个数组：struct chunk { char * data; size_t size; }; chunk * chunks;。每个块中的数据大小是动态的并且块之间不同。使用嵌套的 for 循环可以轻松地对数据进行线性访问：

for (chunk * chunk_it = chunks; chunk_it != chunks + count; ++chunk_it) {
    for (char * it = chunk_it->data; it != chunk_it->data + chunk_it->size; ++it) {
        /* use it here */
    }
}

我想使用 operator[] 作为接口将其转换为对 chunks->data 的随机访问，跨越 多个块 。

它的工作原理是线性搜索正确的块，然后只计算我想要的数据的偏移量。

template <class T>
void random_access(int n) {
    chunk * c;
    for (int i = 0; i < count; ++i) {
        c = chunks + i;
        size_t size = c->size;
        if (n - size < 0) {
            n -= size; // mutate n to fit into current chunk
        } else {
            break; // found
        }
    }

    T * data = reinterpret_cast<T *>(c->data + n);

    // use data here
}

有没有更有效的方法来做到这一点？每次我需要块中的 T 时都这样做会很疯狂。我计划线性迭代所有块数据，但我想在函数外部使用数据，因此需要在内部循环中 return 它（因此我想将其翻转过来）。我还考虑过在内部循环中使用函数指针，但不只是做 chunk_iterator[n] 更好。

Answer 1

我知道你的数据结构比较复杂，但你能不能不这样做？

我构建了 块数据 的连续块并记录了 position 和 size chunks 数组中的每一个 :

class chunk_manager
{
    struct chunk
    {
        std::size_t position;
        std::size_t size;

        chunk(std::size_t position, std::size_t size)
        : position(position), size(size) {}
    };

public:

    void add_chunk(std::string const& chunk)
    {
        m_chunks.emplace_back(m_data.size(), chunk.size());
        m_data.append(chunk);
    }

    char* random_access(std::size_t n) { return &m_data[n]; }

    std::size_t size_in_bytes() const { return m_data.size(); }

private:
    std::vector<chunk> m_chunks;
    std::string m_data;
};

int main()
{
    chunk_manager cm;

    cm.add_chunk("abc");
    cm.add_chunk("def");
    cm.add_chunk("ghi");

    for(auto n = 0ULL; n < cm.size_in_bytes(); ++n)
        std::cout << cm.random_access(n) << '\n';
}

随机访问不同大小的原始缓冲区数组？

Random access to array of raw buffers of different sizes?

c++

arrays

iterator

random-access