如何改进矢量搜索功能?
How do I improve my vector search function?
所以我用 C++ 实现了一个 TCP 服务器,并将所有用户存储在一个向量中。现在我需要一个更通用的函数来搜索多个不同的属性,我该如何改进这段代码?
struct client {
std::string ip_address = "";
int socket_id = 0;
bool blocking = false;
};
enum client_codes {
ip_address,
socket_id,
blocking,
};
template<typename T>
std::vector<client>::iterator search_vector(std::vector<client> &list, int type, T query) {
std::vector<std::function<bool(client)>> comparators;
comparators.push_back([&](client ob) {return ob.ip_address == std::to_string(query); });
comparators.push_back([&](client ob) {return ob.socket_id == query; });
comparators.push_back([&](client ob) {return ob.blocking == query; });
return std::find_if(std::begin(list), std::end(list), [&](client obj) {return comparators[type](obj); });
}
// Implementation
std::vector<client> client_list;
auto search1(search_vector(client_list, socket_id, 321));
auto search2(search_vector(client_list, blocking, true));
auto search3(search_vector(client_list, ip_address, "192.168.0.85"));
这里有一些建议:
- 假设您多次搜索客户端向量 - 而不是使用
std::find_if
,对您的向量进行排序并执行二进制搜索(例如使用 std::equal_range
)。如果您经常添加新客户端,请考虑为最近添加的客户端使用额外的、小型的、未排序的缓冲区,偶尔将两者集成到一个排序向量中。
- 不要将检查搜索类型的代码放在谓词中 - 这样它会一次又一次地得到 运行;并且您还需要基于堆的比较器向量 - 呃! ...而不是在搜索类型上模板化您的搜索功能,并让它使用单个比较器。使用选择适当搜索函数的包装函数。
由于您正在搜索相同类型的不同属性,我想说这是 pointers to members 的罕见用例。以下代码应有助于清理此问题:
struct client {
std::string ip_address = "";
int socket_id = 0;
bool blocking = false;
};
// search_vector accepts a pointer to member of type T, and a value of type T
template<typename T>
std::vector<client>::iterator search_vector(std::vector<client>& list, T client::*member, T value){
return std::find_if(list.begin(), list.end(), [value, member](const client& c){ return c.*member == value; });
}
这就是您现在使用它的方式,没有任何额外的 enums
或特殊逻辑。
auto it1 = search_vector(client_list, &client::socket_id, 321);
auto it2 = search_vector(client_list, &client::blocking, true);
auto it3 = search_vector(client_list, &client::ip_address, "192.168.0.85");
这个精确的search_vector
函数当然仅限于成员变量,以及精确的相等性测试。但是,使用指向 get_ip_address()
.
等函数的成员函数的指针来扩展它会相当简单
为了更普遍,使用 std::function<bool(T)> condition
而不是 T value
的重载也可以帮助您在不需要完全相等时进行更具体的搜索。
所以我用 C++ 实现了一个 TCP 服务器,并将所有用户存储在一个向量中。现在我需要一个更通用的函数来搜索多个不同的属性,我该如何改进这段代码?
struct client {
std::string ip_address = "";
int socket_id = 0;
bool blocking = false;
};
enum client_codes {
ip_address,
socket_id,
blocking,
};
template<typename T>
std::vector<client>::iterator search_vector(std::vector<client> &list, int type, T query) {
std::vector<std::function<bool(client)>> comparators;
comparators.push_back([&](client ob) {return ob.ip_address == std::to_string(query); });
comparators.push_back([&](client ob) {return ob.socket_id == query; });
comparators.push_back([&](client ob) {return ob.blocking == query; });
return std::find_if(std::begin(list), std::end(list), [&](client obj) {return comparators[type](obj); });
}
// Implementation
std::vector<client> client_list;
auto search1(search_vector(client_list, socket_id, 321));
auto search2(search_vector(client_list, blocking, true));
auto search3(search_vector(client_list, ip_address, "192.168.0.85"));
这里有一些建议:
- 假设您多次搜索客户端向量 - 而不是使用
std::find_if
,对您的向量进行排序并执行二进制搜索(例如使用std::equal_range
)。如果您经常添加新客户端,请考虑为最近添加的客户端使用额外的、小型的、未排序的缓冲区,偶尔将两者集成到一个排序向量中。 - 不要将检查搜索类型的代码放在谓词中 - 这样它会一次又一次地得到 运行;并且您还需要基于堆的比较器向量 - 呃! ...而不是在搜索类型上模板化您的搜索功能,并让它使用单个比较器。使用选择适当搜索函数的包装函数。
由于您正在搜索相同类型的不同属性,我想说这是 pointers to members 的罕见用例。以下代码应有助于清理此问题:
struct client {
std::string ip_address = "";
int socket_id = 0;
bool blocking = false;
};
// search_vector accepts a pointer to member of type T, and a value of type T
template<typename T>
std::vector<client>::iterator search_vector(std::vector<client>& list, T client::*member, T value){
return std::find_if(list.begin(), list.end(), [value, member](const client& c){ return c.*member == value; });
}
这就是您现在使用它的方式,没有任何额外的 enums
或特殊逻辑。
auto it1 = search_vector(client_list, &client::socket_id, 321);
auto it2 = search_vector(client_list, &client::blocking, true);
auto it3 = search_vector(client_list, &client::ip_address, "192.168.0.85");
这个精确的search_vector
函数当然仅限于成员变量,以及精确的相等性测试。但是,使用指向 get_ip_address()
.
为了更普遍,使用 std::function<bool(T)> condition
而不是 T value
的重载也可以帮助您在不需要完全相等时进行更具体的搜索。