为什么假设要引入两个参数,即θ0和θ1
Why the hypothesis has to introduce two parameters, namely θ0 and θ1
我正在通过 Andrew Ng 教授的 Coursera 课程学习机器学习。讲师将假设定义为 "input"(x,在我的例子中)的线性函数,如下所示:
hθ(x) = θ0 + θ1(x)
在监督学习中,我们有一些训练数据,并在此基础上尝试 "deduce" 一个将输入紧密映射到相应输出的函数。为了推导该函数,我们将假设引入为输入 (x) 的线性函数。我的问题是,为什么选择涉及两个 θ 的函数?为什么不能像 y
(i
) = a * x
(i
) 其中 a
是系数?稍后我们可以使用算法为给定示例 (i)
找到 a
的 "good" 值?这个问题可能看起来很愚蠢。抱歉,我不是很擅长机器学习,我只是个初学者。请帮助我理解这一点。
谢谢!
a
对应θ1。您提出的线性模型忽略了截距,即 θ0.
考虑一个输出函数 y
等于常数 5
,或者可能等于常数加上 x
的一小部分,它永远不会超过 .01
。如果您的模型没有可以吸收 D.C 的 θ0,那么将误差函数驱动到零将很困难。组件。
我正在通过 Andrew Ng 教授的 Coursera 课程学习机器学习。讲师将假设定义为 "input"(x,在我的例子中)的线性函数,如下所示:
hθ(x) = θ0 + θ1(x)
在监督学习中,我们有一些训练数据,并在此基础上尝试 "deduce" 一个将输入紧密映射到相应输出的函数。为了推导该函数,我们将假设引入为输入 (x) 的线性函数。我的问题是,为什么选择涉及两个 θ 的函数?为什么不能像 y
(i
) = a * x
(i
) 其中 a
是系数?稍后我们可以使用算法为给定示例 (i)
找到 a
的 "good" 值?这个问题可能看起来很愚蠢。抱歉,我不是很擅长机器学习,我只是个初学者。请帮助我理解这一点。
谢谢!
a
对应θ1。您提出的线性模型忽略了截距,即 θ0.
考虑一个输出函数 y
等于常数 5
,或者可能等于常数加上 x
的一小部分,它永远不会超过 .01
。如果您的模型没有可以吸收 D.C 的 θ0,那么将误差函数驱动到零将很困难。组件。