mongocxx 计算集合中的文档

Question

在 shell.

中计算集合中文档的数量既简单又快速（显然是常数时间）

> db.my_collection.count()
12345678
>

在 C++ 中，我尝试这样做：

mongocxx::client client;
mongocxx::database db = MongoInit(client, ...);
vector<string> collection_names;
mongocxx::cursor cursor = db.list_collections();
for (const bsoncxx::document::view& doc : cursor) {
    string collection_name = doc["name"].get_utf8().value.to_string();
    collection_names.push_back(collection_name);
}

bsoncxx::document::view empty_filter;
for (const string& collection_name : collection_names) {
    LOG_INFO << collection_name;
    mongocxx::collection collection = db[collection_name];
    int64_t collection_count = collection.count_documents(empty_filter);
    LOG_INFO << collection_name << "    " << collection_count;
}

此代码有效但出奇地慢。我是不是做错了什么？

Answer 1

count 和 count_documents 是非常不同的函数。

MongoDB 维护有关每个集合的元数据，其中包含存储的文档数量。这个数字在插入文档时递增，在删除文档时递减。此数字可能与集合不同步，因此应将其视为近似值。

count 只是从元数据中读取该数字并 returns 它，允许它在恒定时间内完成。

count_documents 函数扫描集合以获取准确的文档计数，而不是来自元数据的近似计数。

如果您需要快速而不是精确的结果，请使用 estimated_document_count 函数。

mongocxx 计算集合中的文档

mongocxx count documents in collection

c++

mongodb

mongo-c-driver

c++14

mongo-cxx-driver