base64编码字符串中+字符出现的概率
Probability of + character occurrence in base64 encoded string
我有超过 600 万条包含 base64 编码字符串值的数据库记录。
这些是随机 13 位数字的 SHA-256 输出。
当我用SQL LIKE query统计的时候,已经超过300万了。
我想知道是否正常
所以我试着计算+字符出现的概率。
你能证实这个计算吗?
(64^44 - 63^44) / 64^44
(Base64编码由64个字符组成)
- 表示 SHA-256 校验和所需的 base-64 位数 =
256 / log2(64) = 42.6666... = 43
- 一个字符不是的概率
+
= 63/64
- 所有个字符不是
+
的概率=(63/64)^43
- 因此至少一个是
+
的概率=1 - (63/64)^43 = (64^43 - 63^43) / (64^43)
所以您的回答几乎是正确的 - 只是假定了错误的位数。数值在合理误差范围内还是正确的
我有超过 600 万条包含 base64 编码字符串值的数据库记录。
这些是随机 13 位数字的 SHA-256 输出。
当我用SQL LIKE query统计的时候,已经超过300万了。
我想知道是否正常
所以我试着计算+字符出现的概率。
你能证实这个计算吗?
(64^44 - 63^44) / 64^44
(Base64编码由64个字符组成)
- 表示 SHA-256 校验和所需的 base-64 位数 =
256 / log2(64) = 42.6666... = 43
- 一个字符不是的概率
+
=63/64
- 所有个字符不是
+
的概率=(63/64)^43
- 因此至少一个是
+
的概率=1 - (63/64)^43 = (64^43 - 63^43) / (64^43)
所以您的回答几乎是正确的 - 只是假定了错误的位数。数值在合理误差范围内还是正确的