Amazon S3 使用案例 Select

Use case of Amazon S3 Select

我看了一下 the link 并试图理解 s3 select 是什么。

Most applications have to retrieve the entire object and then filter out only the required data for further analysis. S3 Select enables applications to offload the heavy lifting of filtering and accessing data inside objects to the Amazon S3 service.

根据上面的陈述,我试图想象什么是正确的用例。

如果我在 S3 上有一个包含 1 亿行的 excel 文件,我可以使用 S3 Select 查询部分行,而不是下载整个 1 亿行,这对我有帮助吗?

有很多用例。但是有两个明显的情况是中心化时间效率

假设您在 S3 中有这个“具有 1 亿行的 excel 文件”。现在,如果您有 几个 people/department/branches 需要访问它,他们都必须下载、存储和处理它。因为它会被他们每个人单独下载,所以很快你就会发现他们要么拥有旧版本的文件(新版本可以上传到 S3),要么只有不同的版本——一个人今天的版本,另一个将处理上周的版本。使用 S3 select,所有这些都将从存储在 S3 中的对象的 一个版本 查询和获取数据。

此外,如果您有 1 亿条记录,您获取 select 编辑的数据可以 节省大量时间 。试想一个人只需要此文件中的 10 条记录,而其他人需要 1000 条记录。第一个人没有下载 1 亿条记录,而是使用 S3 Select 只找到 10 条记录,而另一个人只得到 his/hers 1000 条记录。这一切都不需要下载 1 亿条记录。

Glacier 中使用 S3 select 带来更多好处,如果需要,您无法从那里轻松下载文件。