R 中回归模型的替代方案?

Alternatives to a regression model in R?

所以我试图解决一个问题,我有一个包含 3 列的数据集,“CustomerID”、“Fast”和“Precise”,其中“CustomerID”只是客户端的编号,“Fast”和相反,“精确”是指客户如何评估某种产品。 “快速”是指产品被快速评估,精度较低,而“精确”则相反;我想了解是否可以可靠地使用“快速”方法,同时保持与“精确”方法相似的精度水平。 一个目标是定义和判断“快速”列和“精确”列之间的关系,但它唯一想到的是线性回归。考虑到数据集由少于 200 个条目组成,还有其他选择吗? 我尝试使用分位数回归模型,但我并不真正理解它是如何工作的,因为它 returns 是一个包含所有可能值的矩阵,而不是每个条目只返回一个值。

两列的摘录是:

   Fast|Precise
     10|  10.3
     25|  15.0
     50|  34.2
     75|  49.4
    100|  71.3
    125|  81.3
    150|  94.0
    175|  104.3
    ...|    ...

回顾一下,我需要做的是弄清楚这两个变量之间存在什么样的关系(考虑到“快速”有步骤而“精确”没有)。 我认为仅使用线性回归有点限制,因为截距的 p 值有点高。

你有什么想法吗?不幸的是,我似乎没有找到解决问题的合理方法,这是我最后的希望。

线性回归似乎是一个合适的解决方案,我真的不明白为什么 p-value 的截距被视为一个问题?

如果您认为可能存在 non-linear 关系,您可以尝试在回归模型中包含二次项(即多项式回归)。或者,您可以尝试黄土回归或广义加性模型来平滑关系。

您可以尝试所有这些方法,看看哪种方法最适合。