如何绘制三维甚至更多维的多元高斯分布
how to plot three or even more dimensional multivariate gaussian distribution
在机器学习和模式识别的研究中,我们知道,如果样本i具有二维特征,如(长度,重量),长度和重量都属于高斯分布,所以我们可以使用多元高斯分布分布来描述它
这只是一个 3d 图,看起来像这样:
其中 z 轴是可能的,
但是如果这个样本 i 具有三维特征 x1, x2 , x3 ....xn 甚至更多,我们如何使用一个图正确地绘制它呢???
您可以使用降维方法来可视化更高维度的数据。
https://scikit-learn.org/stable/auto_examples/manifold/plot_compare_methods.html#sphx-glr-auto-examples-manifold-plot-compare-methods-py
- 将D维数据转换为2维或3维数据
- 根据数据缩减到的维度,在 2 或 3 个数据点上绘制转换后的数据点。
让我们考虑一个例子。取10维高斯
import matplotlib.pyplot as plt
import numpy as np
DIMENSION = 10
mean = np.zeros((DIMENSION,))
cov = np.eye(DIMENSION)
X = np.random.multivariate_normal(mean, cov, 5000)
然后进行降维(我用的是PCA,你可以根据算法对特定类型数据有效性的先验知识选择其他方法)
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
from sklearn.decomposition import PCA
X_2d = PCA(n_components=2).fit_transform(X)
X_3d = PCA(n_components=3).fit_transform(X)
然后绘制它们
fig = plt.figure(figsize=(12,4))
ax = fig.add_subplot(121, projection='3d')
ax.scatter(X_3d[:,0],X_3d[:,1],X_3d[:,2])
plt.title('3D')
fig.add_subplot(122)
plt.scatter(X_2d[:,0], X_2d[:,1])
plt.title('2D')
您也可以玩其他算法。每个都提供不同类型的优势。
我希望这能回答你的问题。
注:在更高维度中,“维度诅咒”等现象也会出现。因此可能无法在较低维度进行精确投影。比如为什么格陵兰岛在制图地图上看起来与非洲的大小相似。
在机器学习和模式识别的研究中,我们知道,如果样本i具有二维特征,如(长度,重量),长度和重量都属于高斯分布,所以我们可以使用多元高斯分布分布来描述它
这只是一个 3d 图,看起来像这样:
其中 z 轴是可能的, 但是如果这个样本 i 具有三维特征 x1, x2 , x3 ....xn 甚至更多,我们如何使用一个图正确地绘制它呢???
您可以使用降维方法来可视化更高维度的数据。 https://scikit-learn.org/stable/auto_examples/manifold/plot_compare_methods.html#sphx-glr-auto-examples-manifold-plot-compare-methods-py
- 将D维数据转换为2维或3维数据
- 根据数据缩减到的维度,在 2 或 3 个数据点上绘制转换后的数据点。
让我们考虑一个例子。取10维高斯
import matplotlib.pyplot as plt
import numpy as np
DIMENSION = 10
mean = np.zeros((DIMENSION,))
cov = np.eye(DIMENSION)
X = np.random.multivariate_normal(mean, cov, 5000)
然后进行降维(我用的是PCA,你可以根据算法对特定类型数据有效性的先验知识选择其他方法)
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
from sklearn.decomposition import PCA
X_2d = PCA(n_components=2).fit_transform(X)
X_3d = PCA(n_components=3).fit_transform(X)
然后绘制它们
fig = plt.figure(figsize=(12,4))
ax = fig.add_subplot(121, projection='3d')
ax.scatter(X_3d[:,0],X_3d[:,1],X_3d[:,2])
plt.title('3D')
fig.add_subplot(122)
plt.scatter(X_2d[:,0], X_2d[:,1])
plt.title('2D')
您也可以玩其他算法。每个都提供不同类型的优势。 我希望这能回答你的问题。
注:在更高维度中,“维度诅咒”等现象也会出现。因此可能无法在较低维度进行精确投影。比如为什么格陵兰岛在制图地图上看起来与非洲的大小相似。