如何通过 AWS 机器学习 SDK 创建数据源

How to create Datasource through AWS Machine Learning SDK

我正在尝试使用 AWS 机器学习 SDK 创建数据源。我有一个数据集,它对应的 schema.Both 存储在 S3.Initially 中我认为我只需要在模式中提供列名。所以最初我的架构看起来像这样 -

ColName1,ColName2,....,ColNameN

后来我意识到我需要将数据类型放入模式而不是标签 names.so 我将我的模式更改为

Number, String,....,String

由于模式不正确,我仍然无法创建数据源。我收到此错误 -

FAILURES (1): There was an error trying to parse the schema: 'Unexpected character ('s' (code 115)): expected a valid value (number, String, array, object, 'true', 'false' or 'null') at [Source: java.io.StringReader@3ef68a3a; line: 1, column: 2]' 

现在我认为我需要以 json 格式提供架构,虽然我不确定,但有人可以提供示例说明要在架构中放入什么吗?

filename- dataset.schema(必须有 .schema 作为架构文件的扩展名)

{
    "version": "1.0",
    "targetAttributeName": "A5",
    "dataFormat": "CSV",
    "dataFileContainsHeader": false,
    "attributes": [
        {
            "attributeName": "A1",
            "attributeType": "TEXT"
        },
        {
            "attributeName": "A2",
            "attributeType": "NUMERIC"
        },
        {
            "attributeName": "A3",
            "attributeType": "CATEGORICAL"
        },
        {
            "attributeName": "A4",
            "attributeType": "TEXT"
        },
        {
            "attributeName": "A5",
            "attributeType": "BINARY"
        }
      ]  
    }