base64编码字符串中+字符出现的概率

Probability of + character occurrence in base64 encoded string

我有超过 600 万条包含 base64 编码字符串值的数据库记录。
这些是随机 13 位数字的 SHA-256 输出。
当我用SQL LIKE query统计的时候,已经超过300万了。

我想知道是否正常
所以我试着计算+字符出现的概率。

你能证实这个计算吗?

(64^44 - 63^44) / 64^44

(Base64编码由64个字符组成)

Wolfram Alpha says, its 0.5

  • 表示 SHA-256 校验和所需的 base-64 位数 = 256 / log2(64) = 42.6666... = 43
  • 一个字符不是的概率+ = 63/64
  • 所有个字符不是+的概率=(63/64)^43
  • 因此至少一个是+的概率=1 - (63/64)^43 = (64^43 - 63^43) / (64^43)

所以您的回答几乎是正确的 - 只是假定了错误的位数。数值在合理误差范围内还是正确的