允许其他人下载我拥有的数据集的最便宜的方法是什么?

What is the cheapest way to allow others to download a dataset I have?

我的机器学习应用程序有一些数据集(总共可能高达 10 GB(压缩))

为了将这些数据集公开给其他人,我相信我必须托管一个服务器并让其他人通过网络下载。

  1. 为此我可以使用的最便宜的服务器是多少? (我查看了 AWS 免费套餐,这些可以使用吗?)
  2. 我需要写一个网络服务器吗?是否有可用于我的用例的预制工具?

您没有说明将下载多少数据 (GB/month),这很重要,因为您需要支付超出初始免费金额 (1 GB/month,我相信,但请检查免费套餐是否提供更多),这与 S3 和 EC2 都相关。

也就是说,我会考虑一些选择。

  1. 将文件存储在 S3 中并通过 CloudFront 从 S3 提供文件可能比 运行 服务器 24x7 托管和提供文件更便宜。

  2. 符合免费套餐使用计划的小型 EC2 服务器,运行 网络或 FTP 服务器,为您的文件提供服务。

  3. 与#1 类似,但您还可以为 S3 下载配置 requester pays。此选项要求您的下载者拥有 AWS 凭证并由您管理他们的访问。在您的情况下可能不可行。

  4. 创建一个包含您的数据的 EBS 卷,拍摄该卷的快照,并 share the snapshot 使用其他 AWS 帐户,然后关闭您的 EC2 实例。此选项要求您的用户是 AWS 账户持有人,并且他们与您共享他们的 AWS 帐号。在您的情况下可能不可行。

  5. AWS SFTP 提供存储在 S3 中的数据。