我可以使用 aws-glue 将数据加载到 aerospike 中吗?

Can I use aws-glue to load data into aerospike?

我正在设计一个应用程序,它应该每 15 分钟从 S3 读取一个 txt 文件,解析由 | 分隔的数据并将这些数据加载到 3 个不同 aws 区域的 aerospike 集群中。 文件大小范围为0-32 GB,它可能包含的记录数在5-1.3亿之间。

我计划在每个 aws 区域部署自定义 Java 进程,该进程将从 S3 下载文件并使用多线程加载到 aerospike 中。

我刚刚遇到 aws glue。谁能告诉我是否可以使用 aws glue 将这一大块数据加载到 aerospike 中?或任何其他关于设置高效和高性能应用程序的建议?

提前致谢!

AWS Glue 执行提取、转换然后加载到 RedShift、EMR 或 Athena。您应该看看 AWS Data Pipeline,使用 ShellCommandActivity 通过提取和转换 运行 您的 s3 数据并将转换后的数据写入 Aerospike。