如何根据correlation/regression in Excel恢复(预测)数据?
How to restore (predict) data based on correlation/regression in Excel?
我有一些数据,其中特征(高度)与输出变量(价格)相关。如何根据这些变量之间的现有依赖性(相关性)恢复高度特征中的缺失数据(空值)?
更清楚一点:
输入和输出变量有明显的相关性。我想预测 excel 的缺失值并不是一个困难的过程。但我需要一些指导如何实施它。
如果你得到了 E2 和 E3 中回归线的斜率 (m) 和截距 (c)(比方说):-
=SLOPE(C2:C9,B2:B9)
=INTERCEPT(C2:C9,B2:B9)
您可以重新排列简单回归方程 y=mx+c 来预测 x 值
x=(y-c)/m
因此您的预测身高为:-
=IF(ISBLANK(B2),(C2-E)/E,B2)
从 D2 开始。
您可以试试 FORECAST¹ function。第一个空白没有足够的前期数据来生成预测结果,因此一个简单的比率就足够了,但可以生成剩余的值并将之前生成的预测结果考虑到它们自己的结果中。
E2中的公式是,
=IF(ISBLANK(B2), FORECAST(C2, B:B, C:C), B2)
¹ 请参阅 Forecasting functions 了解数据预测中的替代算法。
我有一些数据,其中特征(高度)与输出变量(价格)相关。如何根据这些变量之间的现有依赖性(相关性)恢复高度特征中的缺失数据(空值)?
更清楚一点:
输入和输出变量有明显的相关性。我想预测 excel 的缺失值并不是一个困难的过程。但我需要一些指导如何实施它。
如果你得到了 E2 和 E3 中回归线的斜率 (m) 和截距 (c)(比方说):-
=SLOPE(C2:C9,B2:B9)
=INTERCEPT(C2:C9,B2:B9)
您可以重新排列简单回归方程 y=mx+c 来预测 x 值
x=(y-c)/m
因此您的预测身高为:-
=IF(ISBLANK(B2),(C2-E)/E,B2)
从 D2 开始。
您可以试试 FORECAST¹ function。第一个空白没有足够的前期数据来生成预测结果,因此一个简单的比率就足够了,但可以生成剩余的值并将之前生成的预测结果考虑到它们自己的结果中。
E2中的公式是,
=IF(ISBLANK(B2), FORECAST(C2, B:B, C:C), B2)
¹ 请参阅 Forecasting functions 了解数据预测中的替代算法。