mongocxx 计算集合中的文档
mongocxx count documents in collection
在 shell.
中计算集合中文档的数量既简单又快速(显然是常数时间)
> db.my_collection.count()
12345678
>
在 C++ 中,我尝试这样做:
mongocxx::client client;
mongocxx::database db = MongoInit(client, ...);
vector<string> collection_names;
mongocxx::cursor cursor = db.list_collections();
for (const bsoncxx::document::view& doc : cursor) {
string collection_name = doc["name"].get_utf8().value.to_string();
collection_names.push_back(collection_name);
}
bsoncxx::document::view empty_filter;
for (const string& collection_name : collection_names) {
LOG_INFO << collection_name;
mongocxx::collection collection = db[collection_name];
int64_t collection_count = collection.count_documents(empty_filter);
LOG_INFO << collection_name << " " << collection_count;
}
此代码有效但出奇地慢。我是不是做错了什么?
count
和 count_documents
是非常不同的函数。
MongoDB 维护有关每个集合的元数据,其中包含存储的文档数量。这个数字在插入文档时递增,在删除文档时递减。此数字可能与集合不同步,因此应将其视为近似值。
count
只是从元数据中读取该数字并 returns 它,允许它在恒定时间内完成。
count_documents
函数扫描集合以获取准确的文档计数,而不是来自元数据的近似计数。
如果您需要快速而不是精确的结果,请使用 estimated_document_count
函数。
在 shell.
中计算集合中文档的数量既简单又快速(显然是常数时间)> db.my_collection.count()
12345678
>
在 C++ 中,我尝试这样做:
mongocxx::client client;
mongocxx::database db = MongoInit(client, ...);
vector<string> collection_names;
mongocxx::cursor cursor = db.list_collections();
for (const bsoncxx::document::view& doc : cursor) {
string collection_name = doc["name"].get_utf8().value.to_string();
collection_names.push_back(collection_name);
}
bsoncxx::document::view empty_filter;
for (const string& collection_name : collection_names) {
LOG_INFO << collection_name;
mongocxx::collection collection = db[collection_name];
int64_t collection_count = collection.count_documents(empty_filter);
LOG_INFO << collection_name << " " << collection_count;
}
此代码有效但出奇地慢。我是不是做错了什么?
count
和 count_documents
是非常不同的函数。
MongoDB 维护有关每个集合的元数据,其中包含存储的文档数量。这个数字在插入文档时递增,在删除文档时递减。此数字可能与集合不同步,因此应将其视为近似值。
count
只是从元数据中读取该数字并 returns 它,允许它在恒定时间内完成。
count_documents
函数扫描集合以获取准确的文档计数,而不是来自元数据的近似计数。
如果您需要快速而不是精确的结果,请使用 estimated_document_count
函数。