Hipa 的日识别 Phi

De-Identifying PHI For HIPAA

我有一个 SQL 数据库,其中包含 PHI,托管在 AWS 上。我想访问此数据以执行分析,但是,我必须先对数据进行去标识化处理以符合 HIPAA.

我应该如何处理这个问题?我想到了几个办法:

  1. 只需使用 SQL 命令 去识别 数据库。
  2. 从现在开始,每次添加数据库时,将该数据的去标识化版本添加到另一个数据库。然后访问此数据库进行分析。
  3. 从现在开始,每次添加数据库时,将该数据的去标识化版本添加到该数据库中的另一个table。然后使用 SQL 命令访问此 table 进行分析。

保持 HIPAA 合规性的最佳方法是什么?或者,有更好的方法吗?

谢谢!

预算允许,考虑在不同的系统上进行分析,并在 ETL 期间对数据进行去标识化处理。更改源系统以适应此要求将增加维护的复杂性并可能影响其他集成 - 最终可能会成为单体。

有多种方法可以做到这一点:您可以像 jarmod 突出显示的那样进行 AWS DMS (with ongoing replication) with the DB as your source and S3 as target (parquet format). From there you could use Athena 分析,它也支持 parquet 格式,您甚至可以在 Athena 中使用类似 SQL 的查询来分析您的数据。还有 Redshift,发送到另一个关系数据库,其他分析平台等。