AWS SageMaker 最低配置

AWS SageMaker Minimum Configuration

为什么我需要 AWS SageMaker 的容器？如果我想运行 SageMaker 的 Jupyter notebook 上的 Scikit Learn 用于自学目的，是否还需要为其配置 Container？

如果我只想学习 Scikit Learn，SageMaker 的最低配置是什么？例如，我想运行 Scikit Learn 的决策树算法与一组训练数据和一组测试数据。我需要在 SageMaker 上做什么才能执行这些任务？谢谢。

你不需要太多。只是一个对您的角色具有相关权限的 AWS 账户。在 AWS SageMaker 控制台中，您只需单击一下即可运行一个 AWS Notebook 实例。预装了 Sklearn，您可以开箱即用。不需要特殊容器。

作为最低限度，您只需要具有相关权限的 AWS 帐户即可创建 EC2 实例并从您的 S3 读取/写入。仅此而已，只需尝试一下。 :)

You can also access it via the Jupyter Terminal

如果您不关心使用 Sagemaker 的训练和部署功能，那么您只需要创建一个新的 conda_python3 notebook 并导入 sklearn。

我也对如何通过 Scikit Learn 利用 Sagemaker 的 train/deploy 功能感到困惑。最好的解释和最新的似乎是：

简要总结是：

您将训练数据保存到 S3 存储桶。
创建一个独立的 python 脚本来进行训练，将训练模型序列化为文件并将其保存到 S3 存储桶。
在 Sagemaker 上的笔记本中，您导入 Sagemaker SDK 并将其指向您的训练脚本和数据。然后 Sagemaker 将临时创建一个 AWS 实例来训练模型。
一旦经过训练，该实例就会自动销毁。
最后，您使用 Sagemaker SDK 将经过训练的模型部署到另一个 AWS 实例。这也会自动创建一个可以调用以进行预测的端点。