在第一行中找不到空格和冒号

Blankspace and colon not found in firstline

我在 SageMaker 中有一个 jupyter notebook,我想在其中 运行 XGBoost 算法。数据必须符合 3 个标准: -没有 header 行 - 第一列中的结果变量,其余列中的特征 -所有列都必须是数字

我得到的错误如下:

    Error for Training job xgboost-2019-03-13-16-21-25-000: 
    Failed Reason: ClientError: Blankspace and colon not found in firstline 
'0.0,0.0,99.0,314.07,1.0,0.0,0.0,0.0,0.48027846,0.0...' of file 'train.csv'

在错误本身中可以看出没有 headers,输出是第一列(它只需要 1.0 和 0.0 值)并且所有特征都是数字。数据存储在自己的存储桶中。

我在GitHub看到了一个相关的问题,但是那里没有解决方案。此外,Amazon 的示例笔记本在将数据帧保存到 csv 以供以后使用时不会更改默认的 sep 或任何内容。

错误消息表明 XGBoost 期望输入数据集为 libsvm 格式而不是 csv。 SageMaker XGBoost 默认假定输入数据集为 libsvm 格式。要使用 csv 中的输入数据集,请明确指定 content-typetext/csv.

更多信息:https://docs.aws.amazon.com/sagemaker/latest/dg/xgboost.html#InputOutput-XGBoost