如何通过 AWS 机器学习 SDK 创建数据源
How to create Datasource through AWS Machine Learning SDK
我正在尝试使用 AWS 机器学习 SDK 创建数据源。我有一个数据集,它对应的 schema.Both 存储在 S3.Initially 中我认为我只需要在模式中提供列名。所以最初我的架构看起来像这样 -
ColName1,ColName2,....,ColNameN
后来我意识到我需要将数据类型放入模式而不是标签 names.so 我将我的模式更改为
Number, String,....,String
由于模式不正确,我仍然无法创建数据源。我收到此错误 -
FAILURES (1): There was an error trying to parse the schema: 'Unexpected character ('s' (code 115)): expected a valid value (number, String, array, object, 'true', 'false' or 'null') at [Source: java.io.StringReader@3ef68a3a; line: 1, column: 2]'
现在我认为我需要以 json 格式提供架构,虽然我不确定,但有人可以提供示例说明要在架构中放入什么吗?
filename- dataset.schema(必须有 .schema 作为架构文件的扩展名)
{
"version": "1.0",
"targetAttributeName": "A5",
"dataFormat": "CSV",
"dataFileContainsHeader": false,
"attributes": [
{
"attributeName": "A1",
"attributeType": "TEXT"
},
{
"attributeName": "A2",
"attributeType": "NUMERIC"
},
{
"attributeName": "A3",
"attributeType": "CATEGORICAL"
},
{
"attributeName": "A4",
"attributeType": "TEXT"
},
{
"attributeName": "A5",
"attributeType": "BINARY"
}
]
}
我正在尝试使用 AWS 机器学习 SDK 创建数据源。我有一个数据集,它对应的 schema.Both 存储在 S3.Initially 中我认为我只需要在模式中提供列名。所以最初我的架构看起来像这样 -
ColName1,ColName2,....,ColNameN
后来我意识到我需要将数据类型放入模式而不是标签 names.so 我将我的模式更改为
Number, String,....,String
由于模式不正确,我仍然无法创建数据源。我收到此错误 -
FAILURES (1): There was an error trying to parse the schema: 'Unexpected character ('s' (code 115)): expected a valid value (number, String, array, object, 'true', 'false' or 'null') at [Source: java.io.StringReader@3ef68a3a; line: 1, column: 2]'
现在我认为我需要以 json 格式提供架构,虽然我不确定,但有人可以提供示例说明要在架构中放入什么吗?
filename- dataset.schema(必须有 .schema 作为架构文件的扩展名)
{
"version": "1.0",
"targetAttributeName": "A5",
"dataFormat": "CSV",
"dataFileContainsHeader": false,
"attributes": [
{
"attributeName": "A1",
"attributeType": "TEXT"
},
{
"attributeName": "A2",
"attributeType": "NUMERIC"
},
{
"attributeName": "A3",
"attributeType": "CATEGORICAL"
},
{
"attributeName": "A4",
"attributeType": "TEXT"
},
{
"attributeName": "A5",
"attributeType": "BINARY"
}
]
}