AWS SageMaker 最低配置

AWS SageMaker Minimum Configuration

为什么我需要 AWS SageMaker 的容器?如果我想 运行 SageMaker 的 Jupyter notebook 上的 Scikit Learn 用于自学目的,是否还需要为其配置 Container?

如果我只想学习 Scikit Learn,SageMaker 的最低配置是什么?例如,我想 运行 Scikit Learn 的决策树算法与一组训练数据和一组测试数据。我需要在 SageMaker 上做什么才能执行这些任务?谢谢。

你不需要太多。只是一个对您的角色具有相关权限的 AWS 账户。 在 AWS SageMaker 控制台中,您只需单击一下即可 运行 一个 AWS Notebook 实例。预装了 Sklearn,您可以开箱即用。不需要特殊容器。

作为最低限度,您只需要具有相关权限的 AWS 帐户即可创建 EC2 实例并从您的 S3 读取/写入。仅此而已,只需尝试一下。 :)

以此为起点:Amazon SageMaker – Accelerating Machine Learning

You can also access it via the Jupyter Terminal

如果您不关心使用 Sagemaker 的训练和部署功能,那么您只需要创建一个新的 conda_python3 notebook 并导入 sklearn。

我也对如何通过 Scikit Learn 利用 Sagemaker 的 train/deploy 功能感到困惑。最好的解释和最新的似乎是:

https://github.com/aws/sagemaker-python-sdk/blob/master/src/sagemaker/sklearn/README.rst

简要总结是:

  1. 您将训练数据保存到 S3 存储桶。
  2. 创建一个独立的 python 脚本来进行训练,将训练模型序列化为文件并将其保存到 S3 存储桶。
  3. 在 Sagemaker 上的笔记本中,您导入 Sagemaker SDK 并将其指向您的训练脚本和数据。然后 Sagemaker 将临时创建一个 AWS 实例来训练模型。
  4. 一旦经过训练,该实例就会自动销毁。
  5. 最后,您使用 Sagemaker SDK 将经过训练的模型部署到另一个 AWS 实例。这也会自动创建一个可以调用以进行预测的端点。