使用 Dynamodb 数据源构建 s3 数据湖
Build s3 Datalake Using Dynamo DB data source
我是一名使用 AWS 的数据工程师,我们想构建一个数据管道,以便在 QuickSigth 上可视化我们的 Dynmaodb 数据,如您所知,不可能直接断开 dynamo 到 Quick 的连接...您必须路过S3.
S3 将是我们的数据湖,问题是日期更新频繁(例如列名可以更改/客户状态可以演变..)
所以我正在寻找批处理解决方案,以便始终从我的 s3 数据湖上的 dynamo 获取最新数据,并在 quicksigth 中将其可视化。
谢谢你
您可以在控制台中访问 DynamoDB 中的表,并在 Streams and Exports
选项卡下将数据导出到 S3。 This blog post 来自 AWS 的解释正是您所需要的。
您也可以尝试 this approach with Athena 而不是 S3。
我是一名使用 AWS 的数据工程师,我们想构建一个数据管道,以便在 QuickSigth 上可视化我们的 Dynmaodb 数据,如您所知,不可能直接断开 dynamo 到 Quick 的连接...您必须路过S3.
S3 将是我们的数据湖,问题是日期更新频繁(例如列名可以更改/客户状态可以演变..)
所以我正在寻找批处理解决方案,以便始终从我的 s3 数据湖上的 dynamo 获取最新数据,并在 quicksigth 中将其可视化。
谢谢你
您可以在控制台中访问 DynamoDB 中的表,并在 Streams and Exports
选项卡下将数据导出到 S3。 This blog post 来自 AWS 的解释正是您所需要的。
您也可以尝试 this approach with Athena 而不是 S3。