R 中回归模型的替代方案？

Question

所以我试图解决一个问题，我有一个包含 3 列的数据集，“CustomerID”、“Fast”和“Precise”，其中“CustomerID”只是客户端的编号，“Fast”和相反，“精确”是指客户如何评估某种产品。 “快速”是指产品被快速评估，精度较低，而“精确”则相反；我想了解是否可以可靠地使用“快速”方法，同时保持与“精确”方法相似的精度水平。一个目标是定义和判断“快速”列和“精确”列之间的关系，但它唯一想到的是线性回归。考虑到数据集由少于 200 个条目组成，还有其他选择吗？我尝试使用分位数回归模型，但我并不真正理解它是如何工作的，因为它 returns 是一个包含所有可能值的矩阵，而不是每个条目只返回一个值。

两列的摘录是：

   Fast|Precise
     10|  10.3
     25|  15.0
     50|  34.2
     75|  49.4
    100|  71.3
    125|  81.3
    150|  94.0
    175|  104.3
    ...|    ...

回顾一下，我需要做的是弄清楚这两个变量之间存在什么样的关系（考虑到“快速”有步骤而“精确”没有）。我认为仅使用线性回归有点限制，因为截距的 p 值有点高。

你有什么想法吗？不幸的是，我似乎没有找到解决问题的合理方法，这是我最后的希望。

Answer 1

线性回归似乎是一个合适的解决方案，我真的不明白为什么 p-value 的截距被视为一个问题？

如果您认为可能存在 non-linear 关系，您可以尝试在回归模型中包含二次项（即多项式回归）。或者，您可以尝试黄土回归或广义加性模型来平滑关系。

您可以尝试所有这些方法，看看哪种方法最适合。

R 中回归模型的替代方案？

Alternatives to a regression model in R?

regression

r

quantile-regression