ML.NET RandomizedPCA Trainer AUC 未定义
ML.NET RandomizedPCA Trainer AUC not defined
第一次学习如何使用ML.NET
想在数据库上尝试异常检测。
我检索了以下数据:
public string Title { get; set; }
public string CertValidFrom { get; set; }
public string CertValidTo { get; set; }
public float Label { get; set; }
RandomizedPCATrainer 需要标签并设置为 0。
我还对文本进行了特色化:
IEstimator<ITransformer> dataProcessPipeline = mLContext.Transforms
.Text.FeaturizeText("TitleF", "Title")
.Append(mLContext.Transforms.Text.FeaturizeText("CertValidFromF", "CertValidFrom"))
.Append(mLContext.Transforms.Text.FeaturizeText("CertValidToF", "CertValidTo"))
.Append(mLContext.Transforms.Concatenate("Features", "TitleF", "CertValidFromF", "CertValidToF"));
然后我使用了以下选项:
var options = new RandomizedPcaTrainer.Options {
FeatureColumnName = "Features",
ExampleWeightColumnName = null,
Rank = 28,
Oversampling = 20,
EnsureZeroMean = true,
Seed = 1};
但是在使用测试数据评估模型时出现以下错误:
An unhandled exception of type 'System.ArgumentOutOfRangeException' occurred in Microsoft.ML.Core.dll: 'AUC is not defined when there is no positive class in the data'
我没有很多经验,所以我的问题是:
- 这个错误说明了什么?
- dataProcessPipeline 是否正确,它有什么作用?
长话短说,这个算法不适合我的数据集,所以我尝试了一些不同的算法。因此,请注意始终研究您选择的算法的用例。
第一次学习如何使用ML.NET 想在数据库上尝试异常检测。 我检索了以下数据:
public string Title { get; set; }
public string CertValidFrom { get; set; }
public string CertValidTo { get; set; }
public float Label { get; set; }
RandomizedPCATrainer 需要标签并设置为 0。 我还对文本进行了特色化:
IEstimator<ITransformer> dataProcessPipeline = mLContext.Transforms
.Text.FeaturizeText("TitleF", "Title")
.Append(mLContext.Transforms.Text.FeaturizeText("CertValidFromF", "CertValidFrom"))
.Append(mLContext.Transforms.Text.FeaturizeText("CertValidToF", "CertValidTo"))
.Append(mLContext.Transforms.Concatenate("Features", "TitleF", "CertValidFromF", "CertValidToF"));
然后我使用了以下选项:
var options = new RandomizedPcaTrainer.Options {
FeatureColumnName = "Features",
ExampleWeightColumnName = null,
Rank = 28,
Oversampling = 20,
EnsureZeroMean = true,
Seed = 1};
但是在使用测试数据评估模型时出现以下错误:
An unhandled exception of type 'System.ArgumentOutOfRangeException' occurred in Microsoft.ML.Core.dll: 'AUC is not defined when there is no positive class in the data'
我没有很多经验,所以我的问题是:
- 这个错误说明了什么?
- dataProcessPipeline 是否正确,它有什么作用?
长话短说,这个算法不适合我的数据集,所以我尝试了一些不同的算法。因此,请注意始终研究您选择的算法的用例。