在哪里可以找到人类可读的校验和、指纹的无害词列表

Where to find list of innocuous words for human-readable checksums, fingerprints

我有几个应用程序通过应用像 MD5 这样的加密散列来创建一个唯一的(很有可能)、人类可读的校验和或数字签名,然后使用带有算术编码器的结果位到 select 字从列表中。我一直在使用 /usr/share/dict/words,但最近一位客户(正确地)抱怨收到一份文件,其校验和包含冒犯性词语或触发词。 (更多细节在我对 Generate User Friendly Codes 的回答中)。

对于此应用程序,长列表很重要,因为它们可以避免重复——我使用的列表有数万个单词。

有谁知道如何从这样的列表中删除攻击性和触发词,或者在哪里可以找到无害词的列表?

一种可能是 ENABLE 单词列表,用于 Words with Friends 和其他一些游戏。他们尽量避免有争议的词(选择你最喜欢的,你不会在那里找到它们!-)它在 public 域中,所以你可以在这里和那里找到它。它大约有 172,000 个单词。这是我在一个地方找到的:http://www.greenworm.net/sites/default/files/gw-assets/enable1-wwf-v4.0-wordlist.txt

此外,Scrabble 有不同的列表 - 拥有游戏的公司有 "filtered" 列表,而俱乐部使用未经过滤的列表进行比赛。我不想post一个link来冒犯material,但是如果你Google"seattle scrabble club expurgated words",你可能会发现从列表中删除的单词顽皮的名单产生漂亮的名单。如果您在该列表中找到所有您投诉的词,您可以将其用作过滤器。