逻辑回归结果的理解

understanding of result of logistic regression

让我们假设我们有以下数据和二进制响应输出(优惠券)

年消费以第1000个单位给出,我的目标是估计如果客户消费超过2000并且有席梦思卡,是否也会有优惠券,首先我根据响应数据对数据进行了排序,我得到了以下图片

在下一阶段我计算了每个数据的对数,对于那些最初我选择以下系数

B0  0.1
B1  0.1
B2  0.1

我已经根据下面的公式计算了L

在下一阶段我计算了 e^L(在 excel 中可以通过 exp 函数轻松完成)

=EXP(D2)

之后我计算了概率

=E2/(1+E2)

最后使用公式

我已经计算了对数似然函数

然后我计算了总和并使用求解器计算了最小化该总和的系数(请注意值以负值给出),但我得到的所有系数都为零

我错了?或者这是否意味着我不能根据年度消费和拥有 Simmons 卡来预测优惠券的购买?提前致谢

您可以根据年度支出预测购买优惠券(知道席梦​​思卡也无济于事)。

诚然我没有在 Excel 中解决它,但我怀疑问题可能是你的优化没有收敛(即未能通过求解过程达到正确的系数)——正确的系数是 B0 = 5.63、B1 = -2.95 和 B2 = 0。我在 http://blog.excelmasterseries.com/2014/06/logistic-regression-performed-in-excel.html.

找到了 Excel 逻辑回归程序的在线参考

我 运行 我自己进行逻辑回归,发现年度支出很重要(在 0.05 水平),而席梦思卡则不重要。重新运行去除席梦思卡的模型得到以下等式:

    L = 5.63 - 2.95 * Annual spending
    P(1)  =  exp(L)/(1 + exp(L))
    If P(1) > 0.5 => coupon = 1

虽然熵 Rsquare 低至 0.39(并且数据点的数量非常少),但该模型具有统计显着性。