lightgbm线性回归模型构建
lightgbm linear regression model building
我是 lightgbm
包的新手 我正在尝试使用以下示例火车数据构建 linear regression
模型,其中 medianhousevalue 作为 rstudio 中的响应变量
housingMedianAge totalRooms totalBedrooms population households medianIncome medianHouseValue
41 880 129 322 126 8.3252 452600
21 7099 1106 2401 1138 8.3014 358500
52 1467 190 496 177 7.2574 352100
52 1274 235 558 219 5.6431 341300
52 1627 280 565 259 3.8462 342200
52 919 213 413 193 4.0368 269700
52 2535 489 1094 514 3.6591 299200
52 3104 687 1157 647 3.12 241400
42 2555 665 1206 595 2.0804 226700
52 3549 707 1551 714 3.6912 261100
52 2202 434 910 402 3.2031 281500
52 3503 752 1504 734 3.2705 241800
52 2491 474 1098 468 3.075 213500
52 696 191 345 174 2.6736 191300
52 2643 626 1212 620 1.9167 159200
50 1120 283 697 264 2.125 140000
样本测试数据为
50 2239 455 990 419 1.9911
52 1503 298 690 275 2.6033
40 751 184 409 166 1.3578
42 1639 367 929 366 1.7135
52 2436 541 1015 478 1.725
52 1688 337 853 325 2.1806
52 2224 437 1006 422 2.6
请分享代码以在 lightgbm
中使用参数列表构建模型以预测输出。
编辑:将信息从评论移至问题
train <- as.matrix (train)
test <- as.matrix(test)
dtrain <- lgb.Dataset(data = train(,1:5), label = train[, 6])
params <- list(objective = "regression ", metric = "l2" )
model <- lgb.train(params, train, 100, valids, min_data = 1, learning_rate = 1, early_stopping_rounds = 10)
在出现与列车数据帧相关的错误后,它必须在 Dgcmatrix 中
对于第 3 行,替换
train(,1:5)
和
train[,1:5]
(方括号)
我是 lightgbm
包的新手 我正在尝试使用以下示例火车数据构建 linear regression
模型,其中 medianhousevalue 作为 rstudio 中的响应变量
housingMedianAge totalRooms totalBedrooms population households medianIncome medianHouseValue
41 880 129 322 126 8.3252 452600
21 7099 1106 2401 1138 8.3014 358500
52 1467 190 496 177 7.2574 352100
52 1274 235 558 219 5.6431 341300
52 1627 280 565 259 3.8462 342200
52 919 213 413 193 4.0368 269700
52 2535 489 1094 514 3.6591 299200
52 3104 687 1157 647 3.12 241400
42 2555 665 1206 595 2.0804 226700
52 3549 707 1551 714 3.6912 261100
52 2202 434 910 402 3.2031 281500
52 3503 752 1504 734 3.2705 241800
52 2491 474 1098 468 3.075 213500
52 696 191 345 174 2.6736 191300
52 2643 626 1212 620 1.9167 159200
50 1120 283 697 264 2.125 140000
样本测试数据为
50 2239 455 990 419 1.9911
52 1503 298 690 275 2.6033
40 751 184 409 166 1.3578
42 1639 367 929 366 1.7135
52 2436 541 1015 478 1.725
52 1688 337 853 325 2.1806
52 2224 437 1006 422 2.6
请分享代码以在 lightgbm
中使用参数列表构建模型以预测输出。
编辑:将信息从评论移至问题
train <- as.matrix (train)
test <- as.matrix(test)
dtrain <- lgb.Dataset(data = train(,1:5), label = train[, 6])
params <- list(objective = "regression ", metric = "l2" )
model <- lgb.train(params, train, 100, valids, min_data = 1, learning_rate = 1, early_stopping_rounds = 10)
在出现与列车数据帧相关的错误后,它必须在 Dgcmatrix 中
对于第 3 行,替换
train(,1:5)
和
train[,1:5]
(方括号)