矩阵代数 - ValueError - 计算置信区间

Question

我正在尝试使用 delta method 来计算非线性回归模型的置信区间。我的标准误差是 5、3、3 的数组，但我认为标准误差应该是 5 个值，而不是矩阵。尝试从我的预测值中添加或减去 standard_error 数组时出现值错误。任何帮助将不胜感激。

df = pd.DataFrame({
        'cumsum_days': [1,2,3,4,5],
        'pred': [388.259631, 368.389649, 349.754534, 332.264306, 315.836485]})

cov = np.array([[2.67918945e+04, 2.62421460e+02, 9.08452505e+00],
       [2.62421460e+02, 4.31869566e+00, 1.24995272e-01],
       [9.08452505e+00, 1.24995272e-01, 3.90413410e-03]])

# estimate confidence interval for predicted probabilities
gradient = np.gradient(df['pred'], df['cumsum_days'])
std_errors = np.array([np.sqrt(np.dot(np.dot(g, cov), g)) for g in gradient])
c = 1.96 # multiplier for confidence interval

upper = np.maximum(0, np.minimum(1, (df['pred'] + std_errors * c)))
lower = np.maximum(0, np.minimum(1, (df['pred'] - std_errors * c)))

此处出现值错误：

print(df['pred'] + std_errors)
ValueError: operands could not be broadcast together with shapes (5,) (5,3,3)

Answer 1

这是一个形状问题，你的梯度是形状(5,)，你的cov是形状(3,3)，通过遍历梯度中的每个元素g，np.dot(g, cov)将仅将 cov 矩阵的每个元素乘以数字 g (1)，给出形状 (3,3) 并创建形状为 (3,3) 的 5 个元素的列表，因此形状为 (5,3,3) .

我不知道有关 delta 方法的详细信息，但在我看来，您应该有一个形状为 (5,5) 的 cov 矩阵，或者有一个形状为 (3,) 的梯度，方法是删除第一个和最后一个值，然后你就可以做 std_error = np.sqrt(np.dot(np.dot(gradient, cov), gradient))

矩阵代数 - ValueError - 计算置信区间

Matrix Algebra - ValueError - Computing Confidence Intervals

python

gradient

matrix-multiplication

confidence-interval