遍历大型数据集 R-Studio 的每一行
Iterating over each Row of a large dataset R-Studio
假设我有一个包含给定邮政编码的 1500000 个州的列表,我想 运行 我的预测模型(数据库)在该列表上并获得区域的预测,我在以下人员的帮助下做了同样的事情一位先生,这是我的代码:
pred <- sapply(1:nrow(first), function(row) { predict(basdata,first[row, ],estimator="BMA", interval = "predict", se.fit=TRUE)$Ybma })
- 基础数据:我的模型
- 首先:我预测区域的新数据集。
现在,我面临的问题是代码需要很长时间才能预测值。它遍历每一行并计算面积。我的数据集中有 150000 行,我会请求是否有人可以帮助我优化此代码的性能。
我要感谢 onyambu 为我提供了解决方案,因为我只是让预测功能更复杂。以下代码可用于迭代数据集的每一行并使用构建的模型预测值。
predict(basdata,first,estimator="BMA", interval = "predict", se.fit=TRUE)$Ybma
假设我有一个包含给定邮政编码的 1500000 个州的列表,我想 运行 我的预测模型(数据库)在该列表上并获得区域的预测,我在以下人员的帮助下做了同样的事情一位先生,这是我的代码:
pred <- sapply(1:nrow(first), function(row) { predict(basdata,first[row, ],estimator="BMA", interval = "predict", se.fit=TRUE)$Ybma })
- 基础数据:我的模型
- 首先:我预测区域的新数据集。
现在,我面临的问题是代码需要很长时间才能预测值。它遍历每一行并计算面积。我的数据集中有 150000 行,我会请求是否有人可以帮助我优化此代码的性能。
我要感谢 onyambu 为我提供了解决方案,因为我只是让预测功能更复杂。以下代码可用于迭代数据集的每一行并使用构建的模型预测值。
predict(basdata,first,estimator="BMA", interval = "predict", se.fit=TRUE)$Ybma