在第一行中找不到空格和冒号
Blankspace and colon not found in firstline
我在 SageMaker 中有一个 jupyter notebook,我想在其中 运行 XGBoost 算法。数据必须符合 3 个标准:
-没有 header 行
- 第一列中的结果变量,其余列中的特征
-所有列都必须是数字
我得到的错误如下:
Error for Training job xgboost-2019-03-13-16-21-25-000:
Failed Reason: ClientError: Blankspace and colon not found in firstline
'0.0,0.0,99.0,314.07,1.0,0.0,0.0,0.0,0.48027846,0.0...' of file 'train.csv'
在错误本身中可以看出没有 headers,输出是第一列(它只需要 1.0 和 0.0 值)并且所有特征都是数字。数据存储在自己的存储桶中。
我在GitHub看到了一个相关的问题,但是那里没有解决方案。此外,Amazon 的示例笔记本在将数据帧保存到 csv 以供以后使用时不会更改默认的 sep 或任何内容。
错误消息表明 XGBoost 期望输入数据集为 libsvm 格式而不是 csv。 SageMaker XGBoost 默认假定输入数据集为 libsvm 格式。要使用 csv 中的输入数据集,请明确指定 content-type
为 text/csv
.
更多信息:https://docs.aws.amazon.com/sagemaker/latest/dg/xgboost.html#InputOutput-XGBoost
我在 SageMaker 中有一个 jupyter notebook,我想在其中 运行 XGBoost 算法。数据必须符合 3 个标准: -没有 header 行 - 第一列中的结果变量,其余列中的特征 -所有列都必须是数字
我得到的错误如下:
Error for Training job xgboost-2019-03-13-16-21-25-000:
Failed Reason: ClientError: Blankspace and colon not found in firstline
'0.0,0.0,99.0,314.07,1.0,0.0,0.0,0.0,0.48027846,0.0...' of file 'train.csv'
在错误本身中可以看出没有 headers,输出是第一列(它只需要 1.0 和 0.0 值)并且所有特征都是数字。数据存储在自己的存储桶中。
我在GitHub看到了一个相关的问题,但是那里没有解决方案。此外,Amazon 的示例笔记本在将数据帧保存到 csv 以供以后使用时不会更改默认的 sep 或任何内容。
错误消息表明 XGBoost 期望输入数据集为 libsvm 格式而不是 csv。 SageMaker XGBoost 默认假定输入数据集为 libsvm 格式。要使用 csv 中的输入数据集,请明确指定 content-type
为 text/csv
.
更多信息:https://docs.aws.amazon.com/sagemaker/latest/dg/xgboost.html#InputOutput-XGBoost