散列字符串的最佳算法

Best algorithm to hash a string

我想使用算法对长字符串进行散列。

我需要它是唯一的,因为我记录更改,并且不想保留整个字符串(可能从 300 字节到 1000 字节不等)。

我想到了 MD5(也许是 sha - 我不知道),但是这个算法 "promise" 不会有任何重复的算法(即使是一个天文机会 - 机会是多少?)。

是否有更好的算法,尤其是对于字符串值(所有可读的 ascii 值。主要是所有字母和所有数字,包括“-”和“.”)?

谢谢:)

你可以试试Rabin-Karp算法(RK)
Here 是来自 topcoder
的教程 您可以从 here

中学到很多关于散列的知识