在 Snowflake-db 中使用 Sha vs md5 或 Hash
Use Sha vs md5 or Hash in Snowflake-db
首先声明我不会用它来存储密码或任何其他敏感信息 -- 我只是想要一个行级 sha/hash 以便以后使用或快速检查唯一记录.我的表将在长边,在 0.1 - 10 万亿行的范围内。
我正在使用 Snowflake datawarehouse, and thus my options are SHA1, SHA2, MD5 (each with binary options), and HASH。
我想我想尽量减少碰撞的可能性(考虑到长表)同时不要不必要地消耗我的计算积分。
哪个是我的用例的最佳选择?
内置的hash
功能应该足够好,如果你可以接受一些冲突的话。它可以比 MD5/SHA 函数快得多,并且考虑到它的输出,它会产生很好的散列,但它会产生较小范围的散列(64 位输出),因此更有可能导致更多冲突。
如果您不需要冲突,显然没有哈希函数可以保证这一点。
MD5
/SHA
函数在您想要以与使用这些算法之一计算哈希的其他系统兼容的形式计算字符串的哈希时最有用。
首先声明我不会用它来存储密码或任何其他敏感信息 -- 我只是想要一个行级 sha/hash 以便以后使用或快速检查唯一记录.我的表将在长边,在 0.1 - 10 万亿行的范围内。
我正在使用 Snowflake datawarehouse, and thus my options are SHA1, SHA2, MD5 (each with binary options), and HASH。
我想我想尽量减少碰撞的可能性(考虑到长表)同时不要不必要地消耗我的计算积分。
哪个是我的用例的最佳选择?
内置的hash
功能应该足够好,如果你可以接受一些冲突的话。它可以比 MD5/SHA 函数快得多,并且考虑到它的输出,它会产生很好的散列,但它会产生较小范围的散列(64 位输出),因此更有可能导致更多冲突。
如果您不需要冲突,显然没有哈希函数可以保证这一点。
MD5
/SHA
函数在您想要以与使用这些算法之一计算哈希的其他系统兼容的形式计算字符串的哈希时最有用。