如何处理 Azure 机器学习工作室中的缺失值
How to deal with missing values in Azure Machine Learning Studio
看来我有672个任务值,据统计。
QuotedPremium 列中有 NULL 值。
我实现了清理缺失数据模块,它应该用 0 替换缺失值,但出于某种原因我仍然看到 NULL 值作为 QuotedPremium,但是...它说缺失值 = 0
在这里你看到它告诉我缺失值 = 0,但仍然有 NULL
那么在我 运行 清理缺失数据模块之后到底发生了什么?为什么它 运行 成功但仍然有 NULL 值,即使它告诉缺失值的数量是 0。
NULL
确实是一个值;包含 NULL 的条目 而不是 缺失,因此它们既不会被 'Clean Missing Data' 运算符清除,也不会报告为缺失。
因为它们并不是真正的缺失值,所以它是一个字符串 NULL,它被添加到所有这些单元格中。因此,为了用 0 替换这些值,您可以在下面使用:
使用Execute R Script
模块,并在其中添加这段代码。
dataset1 <- maml.mapInputPort(1); # class: data.frame
dataset1[dataset1 == "NULL"] = 0; # Wherever cell's value is "NULL", replace it with 0
maml.mapOutputPort("dataset1"); # return the modified data.frame
图片相同:
看来我有672个任务值,据统计。 QuotedPremium 列中有 NULL 值。
我实现了清理缺失数据模块,它应该用 0 替换缺失值,但出于某种原因我仍然看到 NULL 值作为 QuotedPremium,但是...它说缺失值 = 0
在这里你看到它告诉我缺失值 = 0,但仍然有 NULL
那么在我 运行 清理缺失数据模块之后到底发生了什么?为什么它 运行 成功但仍然有 NULL 值,即使它告诉缺失值的数量是 0。
NULL
确实是一个值;包含 NULL 的条目 而不是 缺失,因此它们既不会被 'Clean Missing Data' 运算符清除,也不会报告为缺失。
因为它们并不是真正的缺失值,所以它是一个字符串 NULL,它被添加到所有这些单元格中。因此,为了用 0 替换这些值,您可以在下面使用:
使用Execute R Script
模块,并在其中添加这段代码。
dataset1 <- maml.mapInputPort(1); # class: data.frame
dataset1[dataset1 == "NULL"] = 0; # Wherever cell's value is "NULL", replace it with 0
maml.mapOutputPort("dataset1"); # return the modified data.frame
图片相同: