Microsoft.ML rel 0.8.0 MLContext 具有不同数据类型的文本文件
Microsoft.ML rel 0.8.0 MLContext with a text file with different data types
我正在尝试将 ML.Net 用于 csv 文件。
该文件包含
- 价格数据(十进制)
- 枚举(与字符串不同的类型)
- 统计数据(浮点数)
我正在尝试按照示例进行操作 provided in MlNetCookBook 但是我无法使用
FeatureVector: r.DecimalField1.ConcatWith(r.DecimalField2, r.EnumType1,r.EnumType2,r.FloatField1,...)
因为类型不兼容,我想 "Dictionarizer" 枚举值。
有谁知道应该如何使用新的 API 配置它?
谢谢
Dictionarizer()/ToKey() 可用于处理分类问题中的字符串标签。输出的类型为 "Key" ,无法与您拥有的数字特征连接。
对于分类(枚举)功能,您可能希望使用 @ClojureMostly 提到的 OneHotEncoding:r.RTH.OneHotEncoding()
。这将输出一个浮点向量,然后可以将其与您拥有的其他数字特征连接起来。
如果您仍然看到错误,能否共享您的 TextLoader 和估算器管道?
我正在尝试将 ML.Net 用于 csv 文件。 该文件包含
- 价格数据(十进制)
- 枚举(与字符串不同的类型)
- 统计数据(浮点数)
我正在尝试按照示例进行操作 provided in MlNetCookBook 但是我无法使用
FeatureVector: r.DecimalField1.ConcatWith(r.DecimalField2, r.EnumType1,r.EnumType2,r.FloatField1,...)
因为类型不兼容,我想 "Dictionarizer" 枚举值。
有谁知道应该如何使用新的 API 配置它?
谢谢
Dictionarizer()/ToKey() 可用于处理分类问题中的字符串标签。输出的类型为 "Key" ,无法与您拥有的数字特征连接。
对于分类(枚举)功能,您可能希望使用 @ClojureMostly 提到的 OneHotEncoding:r.RTH.OneHotEncoding()
。这将输出一个浮点向量,然后可以将其与您拥有的其他数字特征连接起来。
如果您仍然看到错误,能否共享您的 TextLoader 和估算器管道?