Microsoft.ML rel 0.8.0 MLContext 具有不同数据类型的文本文件

Microsoft.ML rel 0.8.0 MLContext with a text file with different data types

我正在尝试将 ML.Net 用于 csv 文件。 该文件包含

  1. 价格数据(十进制)
  2. 枚举(与字符串不同的类型)
  3. 统计数据(浮点数)

我正在尝试按照示例进行操作 provided in MlNetCookBook 但是我无法使用

FeatureVector: r.DecimalField1.ConcatWith(r.DecimalField2, r.EnumType1,r.EnumType2,r.FloatField1,...)

因为类型不兼容,我想 "Dictionarizer" 枚举值。

有谁知道应该如何使用新的 API 配置它?

谢谢

Dictionarizer()/ToKey() 可用于处理分类问题中的字符串标签。输出的类型为 "Key" ,无法与您拥有的数字特征连接。

对于分类(枚举)功能,您可能希望使用 @ClojureMostly 提到的 OneHotEncoding:r.RTH.OneHotEncoding()。这将输出一个浮点向量,然后可以将其与您拥有的其他数字特征连接起来。

如果您仍然看到错误,能否共享您的 TextLoader 和估算器管道?