R - 集成神经网络?

R - ensemble with neural network?

这是我的一个小样本 data.frame

    naiveBayesPrediction knnPred5 knnPred10 dectreePrediction logressionPrediction correctClass
1                non-bob        2         2           non-bob    0.687969711847463            1
2                non-bob        2         2           non-bob     0.85851872253358            1
3                non-bob        1         1           non-bob    0.500470892627383            1
4                non-bob        1         1           non-bob     0.77762739066215            1
5                non-bob        1         2           non-bob    0.556431439357365            1
6                non-bob        1         2           non-bob    0.604868385598237            1
7                non-bob        2         2           non-bob    0.554624186182919            1

我已经考虑了一切

   'data.frame':    505 obs. of  6 variables:
     $ naiveBayesPrediction: Factor w/ 2 levels "bob","non-bob": 2 2 2 2 2 2 2 2 2 2 ...
     $ knnPred5            : Factor w/ 2 levels "1","2": 2 2 1 1 1 1 2 1 2 1 ...
     $ knnPred10           : Factor w/ 2 levels "1","2": 2 2 1 1 2 2 2 1 2 2 ...
     $ dectreePrediction   : Factor w/ 1 level "non-bob": 1 1 1 1 1 1 1 1 1 1 ...
     $ logressionPrediction: Factor w/ 505 levels "0.205412826873861",..: 251 415 48 354 92 145 90 123 28 491 ...
     $ correctClass        : Factor w/ 2 levels "1","2": 1 1 1 1 1 1 1 1 1 1 ...

然后我尝试使用神经网络对其进行集成

ensembleModel <- neuralnet(correctClass ~ naiveBayesPrediction + knnPred5 + knnPred10 + dectreePrediction + logressionPrediction, data=allClassifiers[ensembleTrainSample,])

Error in neurons[[i]] %*% weights[[i]] : requires numeric/complex matrix/vector arguments

然后我尝试放入一个矩阵

m <- model.matrix( correctClass ~ naiveBayesPrediction + knnPred5 + knnPred10 + dectreePrediction + logressionPrediction, data = allClassifiers )

Error in contrasts<-(*tmp*, value = contr.funs[1 + isOF[nn]]) :
contrasts can be applied only to factors with 2 or more levels

我认为这一定与只有 1 个级别的特征 "decistreePrediction" 有关,但它只能从 2 个可能的结果(bob 或非 bob)中找到一个级别,所以我不知道在哪里从那里去。

neuralnet 函数要求 'variables' 为 numericcomplex 值,因为它正在进行需要 numeric 或 [=15] 的矩阵乘法=] 参数。这在返回的错误中非常清楚:

Error in neurons[[i]] %*% weights[[i]] : 
  requires numeric/complex matrix/vector arguments

下面这个简单的例子也反映了这一点。

mat <- matrix(sample(c(1,0), 9, replace=TRUE), 3)
fmat <- mat
mode(fmat) <- "character"

# no error
mat %*% mat

# error
fmat %*% fmat
Error in fmat %*% fmat : requires numeric/complex matrix/vector arguments

作为实际功能的快速演示,我将使用 infert 数据集,它在包中用作演示。

library(neuralnet)
data(infert)

# error
net.infert <- neuralnet(case~as.factor(parity)+induced+spontaneous, infert)
Error in neurons[[i]] %*% weights[[i]] : 
  requires numeric/complex matrix/vector arguments

# no error
net.infert <- neuralnet(case~parity+induced+spontaneous, infert)

您可以将 correctClass 保留为 factor,因为它无论如何都会被转换为虚拟数字变量,但最好也将其转换为相应的二进制表示形式。

我给你的建议是:

  1. 将您的因子转换为相应的二进制表示形式(即 0 和 1)
  2. logressionPrediction 保留为数字
  3. 省略只有 1 个值的变量。包括这些变量是完全多余的,因为用它们无法完成学习。