字符串与哈希作为映射键 - 性能

String versus hash as map key - performance

目前正在为我的游戏引擎编写日志系统。

为了让一切都清楚,我必须为每个 Logger 对象命名。 Logger 对象存储在 LogManager class 中,它跟踪每个 Logger 实例。 Map 正在存储指向 Logger 实例的指针,因为 key 使用 std::string 表示名称。

我正在开发实时 3D 引擎,因此减少延迟非常重要。 所以我想到了第二种存储它的方法——使用快速哈希算法(例如 MurMur Hash 3)并且只存储 64 位哈希而不是字符串。

现在,我的问题是:使用散列而不是字符串作为映射键值在运行时(在我和全球情况下)的性能更好吗?

@编辑访问代码

    std::map<std::string, CLogger*> map1;
std::map<QWORD, CLogger*> map2;

// access :
CLogger * logger = map1["root"];
CLogger * logger = map2[getHashedString("root")];

//

QWORD getHashedString(const std::string string)
{
    QWORD val = 0;
    hash_x64_128(string.c_str(), string.length(), 1234, &val);
    return val;
}

上面使用的算法是MurMur Hash 3 (https://code.google.com/p/smhasher/source/browse/branches/chandlerc_dev/MurmurHash3.cpp)

此致。

你能提供一些访问地图的代码吗?

计算你自己的散列和让访问者计算散列之间的区别在于,也许通过使用你自己的散列,映射的散列参数成为身份函数。

当然。但要确保生成的哈希码是唯一的。性能增益还取决于您使用的地图实现。例如 stl::map 使用搜索树来存储键。在这种情况下,您可以节省大量的字符串比较。如果您使用 stl::unordered_map ,您获得的收益会更少,因为它已经使用了哈希值。但是如果你聪明的话,你仍然可以节省一些哈希计算的运行时间。

一件很重要的事情:测量优化前后的运行时间;)