Amazon Macie 读取数据库数据

Amazon Macie to read database data

我正在 Amazon Macie 中做一些 POC。我从文档中了解到它可以识别信用卡等 PII 数据。甚至我 运行 一个例子,我将一些有效的信用卡号放入 CSV 并放入 S3 存储桶中,并被 Macie 识别。

我想知道相同的 PII 数据是否在某个数据库 backup/dump 文件下,该文件位于 S3 存储桶中。 Macie 能识别吗?我在文档中没有找到任何内容。

这里有几件事很重要

Macie 只能处理某些类型的文件和某些压缩格式

如果您指定的 S3 存储桶包含 Macie 不支持的格式的文件,Macie 不会对其进行分类。

压缩格式 https://docs.aws.amazon.com/macie/latest/userguide/macie-compression-archive-formats.html

加密对象 Macie 只能处理某些类型的加密 Amazon S3 对象 有关详细信息,请参阅以下 link: https://docs.aws.amazon.com/macie/latest/userguide/macie-integration.html#macie-encrypted-objects

Macie 限制

Macie 对其可在帐户中分类的数据量有默认限制。达到此数据限制后,Macie 将停止对数据进行分类。默认数据分类限制为 3 TB。如果需要,可以增加。

Macie 的内容分类引擎最多可处理 S3 对象的前 20 MB。

所以具体来说,如果你的转储是压缩的,但在压缩中采用合适的格式,那么是的,Macie 可以分类,但重要的是,它只会对文件的前 20 MB 进行分类,如果文件是大.

我通常使用 lambda 将一个大文件拆分为不到 20 MB 的文件。您仍然需要考虑,如果您有 X 个文件,您如何从分类为 PII 的文件中获取记录并将其映射回可用的内容。