faker 从哪里得到假数据?

Where does faker get the fake data from?

我需要能够说服我的雇主,并确保我使用 faker 模块生成的数据绝不会是某些真人的 个人身份信息

所以,我真正的问题是:faker 从哪里获取姓名、电子邮件地址、雇主姓名等?它们的来源是什么?谢谢。

更具体地说,所有静态数据都存在于他们的 repo 中:https://github.com/stympy/faker/tree/38f04369bfa11e17cc34f13de3468b6ace371820/lib/locales/en

例如,name.yml 包含用于创建新名称的名字、中间名和姓氏:

https://github.com/stympy/faker/blob/38f04369bfa11e17cc34f13de3468b6ace371820/lib/locales/en/name.yml

如有疑问,您可以随时查看 source code!

基本上 Faker 有名字和姓氏之类的表格,并使用随机函数组合它们。表格的来源也在源代码中列出。在上面链接的示例中,数据来自指定区域的维基百科常用名称列表。

从条目列表中检索数据的 code 如下所示:

  def name(self):
        """
        :example 'John Doe'
        """
        pattern = self.random_element(self.formats)
        return self.generator.parse(pattern)

    def first_name(self):
        return self.random_element(self.first_names)

    def last_name(self):
return self.random_element(self.last_names)