逻辑回归结果的理解
understanding of result of logistic regression
让我们假设我们有以下数据和二进制响应输出(优惠券)
年消费以第1000个单位给出,我的目标是估计如果客户消费超过2000并且有席梦思卡,是否也会有优惠券,首先我根据响应数据对数据进行了排序,我得到了以下图片
在下一阶段我计算了每个数据的对数,对于那些最初我选择以下系数
B0 0.1
B1 0.1
B2 0.1
我已经根据下面的公式计算了L
在下一阶段我计算了 e^L(在 excel 中可以通过 exp 函数轻松完成)
=EXP(D2)
之后我计算了概率
=E2/(1+E2)
最后使用公式
我已经计算了对数似然函数
然后我计算了总和并使用求解器计算了最小化该总和的系数(请注意值以负值给出),但我得到的所有系数都为零
我错了?或者这是否意味着我不能根据年度消费和拥有 Simmons 卡来预测优惠券的购买?提前致谢
您可以根据年度支出预测购买优惠券(知道席梦思卡也无济于事)。
诚然我没有在 Excel 中解决它,但我怀疑问题可能是你的优化没有收敛(即未能通过求解过程达到正确的系数)——正确的系数是 B0 = 5.63、B1 = -2.95 和 B2 = 0。我在 http://blog.excelmasterseries.com/2014/06/logistic-regression-performed-in-excel.html.
找到了 Excel 逻辑回归程序的在线参考
我 运行 我自己进行逻辑回归,发现年度支出很重要(在 0.05 水平),而席梦思卡则不重要。重新运行去除席梦思卡的模型得到以下等式:
L = 5.63 - 2.95 * Annual spending
P(1) = exp(L)/(1 + exp(L))
If P(1) > 0.5 => coupon = 1
虽然熵 Rsquare 低至 0.39(并且数据点的数量非常少),但该模型具有统计显着性。
让我们假设我们有以下数据和二进制响应输出(优惠券)
年消费以第1000个单位给出,我的目标是估计如果客户消费超过2000并且有席梦思卡,是否也会有优惠券,首先我根据响应数据对数据进行了排序,我得到了以下图片
在下一阶段我计算了每个数据的对数,对于那些最初我选择以下系数
B0 0.1
B1 0.1
B2 0.1
我已经根据下面的公式计算了L
在下一阶段我计算了 e^L(在 excel 中可以通过 exp 函数轻松完成)
=EXP(D2)
之后我计算了概率
=E2/(1+E2)
最后使用公式
我已经计算了对数似然函数
然后我计算了总和并使用求解器计算了最小化该总和的系数(请注意值以负值给出),但我得到的所有系数都为零
我错了?或者这是否意味着我不能根据年度消费和拥有 Simmons 卡来预测优惠券的购买?提前致谢
您可以根据年度支出预测购买优惠券(知道席梦思卡也无济于事)。
诚然我没有在 Excel 中解决它,但我怀疑问题可能是你的优化没有收敛(即未能通过求解过程达到正确的系数)——正确的系数是 B0 = 5.63、B1 = -2.95 和 B2 = 0。我在 http://blog.excelmasterseries.com/2014/06/logistic-regression-performed-in-excel.html.
找到了 Excel 逻辑回归程序的在线参考我 运行 我自己进行逻辑回归,发现年度支出很重要(在 0.05 水平),而席梦思卡则不重要。重新运行去除席梦思卡的模型得到以下等式:
L = 5.63 - 2.95 * Annual spending
P(1) = exp(L)/(1 + exp(L))
If P(1) > 0.5 => coupon = 1
虽然熵 Rsquare 低至 0.39(并且数据点的数量非常少),但该模型具有统计显着性。