使用加密的 - 哈希电子商务客户电子邮件作为 Google 分析用户 ID
Use encrypted - hashed e-commerce customer email as Google Analytics User ID
可以使用加密的散列电子商务客户电子邮件作为 Google 分析用户 ID 吗?
我在 Google Analytics 中找到了关于使用 PII 的不同隐私政策部分。例如,警告部分的 here it says , it is ok to use the encrypted hashed form of the Data . But here 表示我们不允许使用 PII 数据。我将使用 Measurement Protocol 和 GTM 将数据发送到 Google Analytics。
如果我使用适当级别的加密 + 散列,那么可以在 google 分析中使用客户电子邮件地址(以散列加密形式)作为用户 ID 吗?
此致,
莉娜
是的,可以使用 SHA256 散列 PII 数据,就像您指出的那样,散列会破坏原始数据,因此它不再是 PII:cryptographic hash functions such as SHA256 are one-way functions,因此从输出中你无法计算出输入(仅供参考,你可以强制生成与给定输出匹配的输入 - 特别是使用较弱的算法,如 MD5
- 到闯入系统 - 例如猜测密码 - 但出于隐藏 PII 的目的,它仍然在做它的工作:你根本无法确定原来的 PII 是什么,所以就保护 PII 而言,任务已经完成。
使用散列法生成用户 ID 的唯一缺点是冲突:SHA256 产生 2^256 种可能的输出,所以如果你真的不走运(# emails / 2^ 256 = 冲突机会)不同的电子邮件可能会产生相同的 SHA-256 哈希值,从而产生相同的用户 ID,在这种情况下,不同的用户将被错误地识别为同一用户。 为了减少冲突的可能性,您可以将散列与其他属性结合起来,例如{user_signup_timestamp}-{email_hash}
,但是防止冲突的唯一方法是依靠数据库 ID对于每个用户,因为数据库将确保每个用户 ID 都是唯一的。
可以使用加密的散列电子商务客户电子邮件作为 Google 分析用户 ID 吗? 我在 Google Analytics 中找到了关于使用 PII 的不同隐私政策部分。例如,警告部分的 here it says , it is ok to use the encrypted hashed form of the Data . But here 表示我们不允许使用 PII 数据。我将使用 Measurement Protocol 和 GTM 将数据发送到 Google Analytics。
如果我使用适当级别的加密 + 散列,那么可以在 google 分析中使用客户电子邮件地址(以散列加密形式)作为用户 ID 吗?
此致, 莉娜
是的,可以使用 SHA256 散列 PII 数据,就像您指出的那样,散列会破坏原始数据,因此它不再是 PII:cryptographic hash functions such as SHA256 are one-way functions,因此从输出中你无法计算出输入(仅供参考,你可以强制生成与给定输出匹配的输入 - 特别是使用较弱的算法,如 MD5
- 到闯入系统 - 例如猜测密码 - 但出于隐藏 PII 的目的,它仍然在做它的工作:你根本无法确定原来的 PII 是什么,所以就保护 PII 而言,任务已经完成。
使用散列法生成用户 ID 的唯一缺点是冲突:SHA256 产生 2^256 种可能的输出,所以如果你真的不走运(# emails / 2^ 256 = 冲突机会)不同的电子邮件可能会产生相同的 SHA-256 哈希值,从而产生相同的用户 ID,在这种情况下,不同的用户将被错误地识别为同一用户。 为了减少冲突的可能性,您可以将散列与其他属性结合起来,例如{user_signup_timestamp}-{email_hash}
,但是防止冲突的唯一方法是依靠数据库 ID对于每个用户,因为数据库将确保每个用户 ID 都是唯一的。