AWS 机器学习 Boto3 拆分数据
AWS Machine Learning Boto3 Splitting Data
使用 boto3 创建 AWS 机器学习模型时,是否有一种简单的方法可以在训练模型时拆分数据源(例如,70% 用于训练源,30% 用于评估)。我知道这在网站界面上很容易做到,而且我认为在 boto3 中也会类似。然而,据我所知,它使用我的整个数据源来训练模型,所以我没有什么可以评估它的。我是否只需将我的数据源手动拆分为两个单独的文件?
您可以使用 data rearrangement.
本文档描述了使用前 70% 创建数据源:
{
"splitting": {
"percentBegin": 0,
"percentEnd": 70,
"complement": false,
"strategy": "sequential"
}
}
This repo 还展示了如何使用 boto3 拆分成训练和测试。
使用 boto3 创建 AWS 机器学习模型时,是否有一种简单的方法可以在训练模型时拆分数据源(例如,70% 用于训练源,30% 用于评估)。我知道这在网站界面上很容易做到,而且我认为在 boto3 中也会类似。然而,据我所知,它使用我的整个数据源来训练模型,所以我没有什么可以评估它的。我是否只需将我的数据源手动拆分为两个单独的文件?
您可以使用 data rearrangement.
本文档描述了使用前 70% 创建数据源:
{
"splitting": {
"percentBegin": 0,
"percentEnd": 70,
"complement": false,
"strategy": "sequential"
}
}
This repo 还展示了如何使用 boto3 拆分成训练和测试。