高斯簇是线性可分的吗?

Are Gaussian clusters linearly separable?

假设您有两个二维高斯概率分布,第一个以 (0,1) 为中心,第二个以 (0,-1) 为中心。 (为简单起见,假设它们具有相同的方差。)是否可以认为从这两个高斯分布中采样的数据点簇是线性可分的?

直观上,很明显分隔两个分布的边界是线性的,在我们的例子中即为横坐标。然而,线性可分性的正式要求是聚类的凸包不重叠。这不可能是高斯生成的集群的情况,因为它们的潜在概率分布遍及所有 R^2(尽管远离平均值的概率可以忽略不计)。

那么,高斯生成的簇是线性可分的吗?如何调和凸包的要求与直线是唯一可能的事实 "boundary"?或者,也许,一旦图片中出现不等方差,边界实际上就不再是线性的了?

高斯集群实例可能是可分离的,也可能是不可分离的。这取决于结果,而不是产生结果的过程。

线性可分性can be defined a作为将两组点分开的平面的存在,使得一组点完全在平面的一侧,而另一组点完全在平面的一侧飞机的另一边。

现在采用您的特定高斯分布。 可能 他们生成了两个线性可分的集合(横坐标与否)。但是,如果概率为 1,如果方差不为零,并且您让过程生成足够多的点,则结果将不是线性可分的。

所以,再说一次,这是结果的问题,而不是过程的问题。

根据定义,高斯簇是无限的。它们几乎无处不在,只是密度不同。

因此,它们不能分离,无论线性与否。 "separability" 的概念在这里不起作用。