Google Cloud DLP Re-identify 使用确定性加密的 PII 数据

Google Cloud DLP Re-identify PII data using Deterministic encryption

我正在试验 Google 使用 AES-SIV

使用确定性加密将文章提供给 re-identify 信用卡号

https://cloud.google.com/solutions/creating-cloud-dlp-de-identification-transformation-templates-pii-dataset#creating_a_key_encryption_key_kek

因此,我为 de-identify 数据创建了一个 google DLP 模板,并且在模板的测试选项中,如果我们提供具有正确 header 的 3 行 csv,它就可以工作名称[我正在使用记录类型模板]

DLP Template

DLP Template Test

根据下面link和提供的视频,可以使用相同的模板re-identify将数据还原为原始

"Cloud DLP can perform both de-identification and re-identification on an entire column using a RecordTransformation without a surrogate annotation."

https://cloud.google.com/dlp/docs/pseudonymization#cryptographic-hashing

但是当我们尝试同样的操作时,它又是 re-encoding 它再次成为一个新的编码值,如下所示。

DLP Template Re-identify Not working

请让我知道我做错了什么以及如何re-identify PII 使用确定性加密 AES-SIV 成功

注意:这与我继续阅读前面的文章时遇到的行为相同,但未按博客中的预期工作 re-identify 数据

https://cloud.google.com/solutions/validating-de-identified-data-bigquery-re-identifying-pii-data

您无法在控制台上重新验证,为此您需要使用 API。而且,因为你不使用代理前缀,你必须在 JSON 中重建你的 table(这样做很无聊......或者你可以编写脚本)。

您有 API here

的完整详细信息

JSON登顶:table(你的去标识化table和模板使用)

{
  "item": {
    "table": {
      "headers": [
        {
          "name": "id"
        },
        {
          "name": "phone"
        },
        {
          "name": "email"
        }
      ],
      "rows": [
        {
          "values": [
            {
              "stringValue": "1"
            },
            {
              "stringValue": "ASoxvJC6oo4fCgKm+ppgT6j2lSqdj179SbLc"
            },
            {
              "stringValue": "ARkspehZ720J0f/r5zqlVN65PS756cxQDbwSniZ+g8iV"
            }
          ]
        },
        {
          "values": [
            {
              "stringValue": "2"
            },
            {
              "stringValue": "ATfmBVs25TEGYHLu+6DBBhpq6dk8LSJq+XyR"
            },
            {
              "stringValue": "AZZhJLTmQKjlcXEROCRPu9u81G98/SBac/AlWXwtgiYe"
            }
          ]
        }
      ]
    }
  },
  "reidentifyTemplateName": "projects/<YOUR_PROJECT>/locations/global/deidentifyTemplates/test-email-DeId"
}

我将内容保存在名为:dlpdata.json

的文件中

curl请求调用API

curl -H "Content-type: application/json"  \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -X POST -d @dlpdata.json \
     https://dlp.googleapis.com/v2/projects/<YOUR_PROJECT>/content:reidentify