R 中回归模型的替代方案?
Alternatives to a regression model in R?
所以我试图解决一个问题,我有一个包含 3 列的数据集,“CustomerID”、“Fast”和“Precise”,其中“CustomerID”只是客户端的编号,“Fast”和相反,“精确”是指客户如何评估某种产品。
“快速”是指产品被快速评估,精度较低,而“精确”则相反;我想了解是否可以可靠地使用“快速”方法,同时保持与“精确”方法相似的精度水平。
一个目标是定义和判断“快速”列和“精确”列之间的关系,但它唯一想到的是线性回归。考虑到数据集由少于 200 个条目组成,还有其他选择吗?
我尝试使用分位数回归模型,但我并不真正理解它是如何工作的,因为它 returns 是一个包含所有可能值的矩阵,而不是每个条目只返回一个值。
两列的摘录是:
Fast|Precise
10| 10.3
25| 15.0
50| 34.2
75| 49.4
100| 71.3
125| 81.3
150| 94.0
175| 104.3
...| ...
回顾一下,我需要做的是弄清楚这两个变量之间存在什么样的关系(考虑到“快速”有步骤而“精确”没有)。
我认为仅使用线性回归有点限制,因为截距的 p 值有点高。
你有什么想法吗?不幸的是,我似乎没有找到解决问题的合理方法,这是我最后的希望。
线性回归似乎是一个合适的解决方案,我真的不明白为什么 p-value 的截距被视为一个问题?
如果您认为可能存在 non-linear 关系,您可以尝试在回归模型中包含二次项(即多项式回归)。或者,您可以尝试黄土回归或广义加性模型来平滑关系。
您可以尝试所有这些方法,看看哪种方法最适合。
所以我试图解决一个问题,我有一个包含 3 列的数据集,“CustomerID”、“Fast”和“Precise”,其中“CustomerID”只是客户端的编号,“Fast”和相反,“精确”是指客户如何评估某种产品。 “快速”是指产品被快速评估,精度较低,而“精确”则相反;我想了解是否可以可靠地使用“快速”方法,同时保持与“精确”方法相似的精度水平。 一个目标是定义和判断“快速”列和“精确”列之间的关系,但它唯一想到的是线性回归。考虑到数据集由少于 200 个条目组成,还有其他选择吗? 我尝试使用分位数回归模型,但我并不真正理解它是如何工作的,因为它 returns 是一个包含所有可能值的矩阵,而不是每个条目只返回一个值。
两列的摘录是:
Fast|Precise
10| 10.3
25| 15.0
50| 34.2
75| 49.4
100| 71.3
125| 81.3
150| 94.0
175| 104.3
...| ...
回顾一下,我需要做的是弄清楚这两个变量之间存在什么样的关系(考虑到“快速”有步骤而“精确”没有)。 我认为仅使用线性回归有点限制,因为截距的 p 值有点高。
你有什么想法吗?不幸的是,我似乎没有找到解决问题的合理方法,这是我最后的希望。
线性回归似乎是一个合适的解决方案,我真的不明白为什么 p-value 的截距被视为一个问题?
如果您认为可能存在 non-linear 关系,您可以尝试在回归模型中包含二次项(即多项式回归)。或者,您可以尝试黄土回归或广义加性模型来平滑关系。
您可以尝试所有这些方法,看看哪种方法最适合。