在 R 中为逻辑回归模型创建综合数据集
Creating a synthetic dataset for logisitc regression model in R
我正在尝试为 200
个样本随机创建的点创建一个(合成)数据集。问题是我得到了重复的列名,但我的要求是我只想要一个 target
列 y
这是我的方法:
#For samples
library(mvtnorm)
library(fontawesome)
a1 <- c(1, 0)
a2 <- c(0, 1)
M <- cbind(a1, a2)
C0 <- rmvnorm(100, c(0, 0), M)
C1 <- rmvnorm(100, c(5, 0), M)
#Creating synthetic dataset
dat <- rbind(C0, C1)
y <- sign(-1 - 2 * x1 + 4 * x2 )
y[y == -1] <- 0
df1 <- cbind.data.frame(y, C)
df1
想知道我的流程有什么问题
df1
的输出
如果'y'需要从'dat'
创建
y <- sign(-1 - 2 * dat[,1] + 4 * dat[,2] )
现在,'df' 将是
head(df1)
# y X1 X2
#1 0 -0.7846368 0.2959261
#2 0 1.6764476 0.8565073
#3 0 -0.9609016 -0.2585588
#4 0 0.5455316 0.2600099
#5 1 -1.5251354 0.2887918
#6 0 -0.1563197 0.2524742
我正在尝试为 200
个样本随机创建的点创建一个(合成)数据集。问题是我得到了重复的列名,但我的要求是我只想要一个 target
列 y
这是我的方法:
#For samples
library(mvtnorm)
library(fontawesome)
a1 <- c(1, 0)
a2 <- c(0, 1)
M <- cbind(a1, a2)
C0 <- rmvnorm(100, c(0, 0), M)
C1 <- rmvnorm(100, c(5, 0), M)
#Creating synthetic dataset
dat <- rbind(C0, C1)
y <- sign(-1 - 2 * x1 + 4 * x2 )
y[y == -1] <- 0
df1 <- cbind.data.frame(y, C)
df1
想知道我的流程有什么问题
df1
的输出
如果'y'需要从'dat'
创建 y <- sign(-1 - 2 * dat[,1] + 4 * dat[,2] )
现在,'df' 将是
head(df1)
# y X1 X2
#1 0 -0.7846368 0.2959261
#2 0 1.6764476 0.8565073
#3 0 -0.9609016 -0.2585588
#4 0 0.5455316 0.2600099
#5 1 -1.5251354 0.2887918
#6 0 -0.1563197 0.2524742