使用 R 中的分类数据建立预测模型
Building prediction model using categorical data in R
我是机器学习的新手,但是,我正在尝试建立一个预测模型,我所有的训练集变量都是分类的,
PREDICTOR_1 PREDICTOR_2 PREDICTOR_3
Found : 5 Best Match :2 Found, Supplier site: 5
No result : 2 Found :8 Found, Zone site : 1
Part NotFound:11 Not Found WDA:8 No Data Found :12
PREDICTOR_4 PREDICTOR_5 PREDICTOR_6
No result :11 Found with Different length: 1 High :10
Search begin: 7 No result :16 LOW : 4
Part Found With out Suffix : 1 No result: 4
PREDICTOR_7 PREDICTOR_8 PREDICTOR_9 RESULT
Direct_Match: 8 NO :8 Mpn Found within PCN: 3 Found :15
No result :10 YES :8 Mpn has no PCN :15 Not Found: 3
YES-REMOVE:2
我尝试使用 R 的 glm() 函数,但我不断得到
Warning message:
glm.fit: fitted probabilities numerically 0 or 1 occurred
1- 我想知道是否可以仅使用分类数据来训练模型
2- 这个错误是什么意思
1 这可以在 glm 模型中仅使用分类数据
2 当一个(或多个)解释变量与响应变量的相关性等于 1 或 -1.I 建议您首先删除相关的解释变量(与其他解释变量)并删除此类解释变量与响应变量的相关性等于 1 或 -1。这可以通过 R 中的 cor
函数来完成。我建议对分类数据使用 Kendal 相关系数。尝试 cor( data, method = "kendall")
我是机器学习的新手,但是,我正在尝试建立一个预测模型,我所有的训练集变量都是分类的,
PREDICTOR_1 PREDICTOR_2 PREDICTOR_3
Found : 5 Best Match :2 Found, Supplier site: 5
No result : 2 Found :8 Found, Zone site : 1
Part NotFound:11 Not Found WDA:8 No Data Found :12
PREDICTOR_4 PREDICTOR_5 PREDICTOR_6
No result :11 Found with Different length: 1 High :10
Search begin: 7 No result :16 LOW : 4
Part Found With out Suffix : 1 No result: 4
PREDICTOR_7 PREDICTOR_8 PREDICTOR_9 RESULT
Direct_Match: 8 NO :8 Mpn Found within PCN: 3 Found :15
No result :10 YES :8 Mpn has no PCN :15 Not Found: 3
YES-REMOVE:2
我尝试使用 R 的 glm() 函数,但我不断得到
Warning message:
glm.fit: fitted probabilities numerically 0 or 1 occurred
1- 我想知道是否可以仅使用分类数据来训练模型
2- 这个错误是什么意思
1 这可以在 glm 模型中仅使用分类数据
2 当一个(或多个)解释变量与响应变量的相关性等于 1 或 -1.I 建议您首先删除相关的解释变量(与其他解释变量)并删除此类解释变量与响应变量的相关性等于 1 或 -1。这可以通过 R 中的 cor
函数来完成。我建议对分类数据使用 Kendal 相关系数。尝试 cor( data, method = "kendall")