Google Cloud DLP Re-identify 使用确定性加密的 PII 数据
Google Cloud DLP Re-identify PII data using Deterministic encryption
我正在试验 Google 使用 AES-SIV
使用确定性加密将文章提供给 re-identify 信用卡号
因此,我为 de-identify 数据创建了一个 google DLP 模板,并且在模板的测试选项中,如果我们提供具有正确 header 的 3 行 csv,它就可以工作名称[我正在使用记录类型模板]
DLP Template
DLP Template Test
根据下面link和提供的视频,可以使用相同的模板re-identify将数据还原为原始
"Cloud DLP can perform both de-identification and re-identification on
an entire column using a RecordTransformation without a surrogate
annotation."
https://cloud.google.com/dlp/docs/pseudonymization#cryptographic-hashing
但是当我们尝试同样的操作时,它又是 re-encoding 它再次成为一个新的编码值,如下所示。
DLP Template Re-identify Not working
请让我知道我做错了什么以及如何re-identify PII 使用确定性加密 AES-SIV 成功
注意:这与我继续阅读前面的文章时遇到的行为相同,但未按博客中的预期工作 re-identify 数据
https://cloud.google.com/solutions/validating-de-identified-data-bigquery-re-identifying-pii-data
您无法在控制台上重新验证,为此您需要使用 API。而且,因为你不使用代理前缀,你必须在 JSON 中重建你的 table(这样做很无聊......或者你可以编写脚本)。
您有 API here
的完整详细信息
JSON登顶:table(你的去标识化table和模板使用)
{
"item": {
"table": {
"headers": [
{
"name": "id"
},
{
"name": "phone"
},
{
"name": "email"
}
],
"rows": [
{
"values": [
{
"stringValue": "1"
},
{
"stringValue": "ASoxvJC6oo4fCgKm+ppgT6j2lSqdj179SbLc"
},
{
"stringValue": "ARkspehZ720J0f/r5zqlVN65PS756cxQDbwSniZ+g8iV"
}
]
},
{
"values": [
{
"stringValue": "2"
},
{
"stringValue": "ATfmBVs25TEGYHLu+6DBBhpq6dk8LSJq+XyR"
},
{
"stringValue": "AZZhJLTmQKjlcXEROCRPu9u81G98/SBac/AlWXwtgiYe"
}
]
}
]
}
},
"reidentifyTemplateName": "projects/<YOUR_PROJECT>/locations/global/deidentifyTemplates/test-email-DeId"
}
我将内容保存在名为:dlpdata.json
的文件中
curl请求调用API
curl -H "Content-type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-X POST -d @dlpdata.json \
https://dlp.googleapis.com/v2/projects/<YOUR_PROJECT>/content:reidentify
我正在试验 Google 使用 AES-SIV
使用确定性加密将文章提供给 re-identify 信用卡号因此,我为 de-identify 数据创建了一个 google DLP 模板,并且在模板的测试选项中,如果我们提供具有正确 header 的 3 行 csv,它就可以工作名称[我正在使用记录类型模板]
DLP Template
DLP Template Test
根据下面link和提供的视频,可以使用相同的模板re-identify将数据还原为原始
"Cloud DLP can perform both de-identification and re-identification on an entire column using a RecordTransformation without a surrogate annotation."
https://cloud.google.com/dlp/docs/pseudonymization#cryptographic-hashing
但是当我们尝试同样的操作时,它又是 re-encoding 它再次成为一个新的编码值,如下所示。
DLP Template Re-identify Not working
请让我知道我做错了什么以及如何re-identify PII 使用确定性加密 AES-SIV 成功
注意:这与我继续阅读前面的文章时遇到的行为相同,但未按博客中的预期工作 re-identify 数据
https://cloud.google.com/solutions/validating-de-identified-data-bigquery-re-identifying-pii-data
您无法在控制台上重新验证,为此您需要使用 API。而且,因为你不使用代理前缀,你必须在 JSON 中重建你的 table(这样做很无聊......或者你可以编写脚本)。
您有 API here
的完整详细信息JSON登顶:table(你的去标识化table和模板使用)
{
"item": {
"table": {
"headers": [
{
"name": "id"
},
{
"name": "phone"
},
{
"name": "email"
}
],
"rows": [
{
"values": [
{
"stringValue": "1"
},
{
"stringValue": "ASoxvJC6oo4fCgKm+ppgT6j2lSqdj179SbLc"
},
{
"stringValue": "ARkspehZ720J0f/r5zqlVN65PS756cxQDbwSniZ+g8iV"
}
]
},
{
"values": [
{
"stringValue": "2"
},
{
"stringValue": "ATfmBVs25TEGYHLu+6DBBhpq6dk8LSJq+XyR"
},
{
"stringValue": "AZZhJLTmQKjlcXEROCRPu9u81G98/SBac/AlWXwtgiYe"
}
]
}
]
}
},
"reidentifyTemplateName": "projects/<YOUR_PROJECT>/locations/global/deidentifyTemplates/test-email-DeId"
}
我将内容保存在名为:dlpdata.json
curl请求调用API
curl -H "Content-type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-X POST -d @dlpdata.json \
https://dlp.googleapis.com/v2/projects/<YOUR_PROJECT>/content:reidentify