Python, Numpy - 规范化 matrix/array
Python, Numpy - Normalize a matrix/array
这很可能是一个愚蠢的问题,但作为 Python/Numpy 的初学者,我还是会问的。我看过很多关于如何在 numpy 中 规范化 array/matrix 的帖子。但我不确定为什么。 Why/When array/matrix 需要在 numpy 中标准化吗?什么时候使用?
规范化在不同的上下文中可以有多种含义。我的问题属于数据 Analytics/Data 科学领域。在这种情况下,规范化意味着什么?或者更具体地说,在什么情况下我应该规范化数组?
这个问题的第二部分是 - 规范化有哪些不同的方法,它们可以在所有情况下互换使用吗?
第三部分也是最后一部分 - 归一化可以用于任何维度的数组吗?
任何参考资料的链接 material(对于初学者)将不胜感激。
考虑尝试对具有两个数值属性 A 和 B 的对象进行聚类。两者同样重要。属性 A 的范围为 0 到 1000,属性 B 的范围为 0 到 5。
如果您没有规范化 A 和 B,那么在应用任何标准距离度量时,您最终会得到属性 A 完全压倒属性 B。
这很可能是一个愚蠢的问题,但作为 Python/Numpy 的初学者,我还是会问的。我看过很多关于如何在 numpy 中 规范化 array/matrix 的帖子。但我不确定为什么。 Why/When array/matrix 需要在 numpy 中标准化吗?什么时候使用?
规范化在不同的上下文中可以有多种含义。我的问题属于数据 Analytics/Data 科学领域。在这种情况下,规范化意味着什么?或者更具体地说,在什么情况下我应该规范化数组?
这个问题的第二部分是 - 规范化有哪些不同的方法,它们可以在所有情况下互换使用吗?
第三部分也是最后一部分 - 归一化可以用于任何维度的数组吗?
任何参考资料的链接 material(对于初学者)将不胜感激。
考虑尝试对具有两个数值属性 A 和 B 的对象进行聚类。两者同样重要。属性 A 的范围为 0 到 1000,属性 B 的范围为 0 到 5。
如果您没有规范化 A 和 B,那么在应用任何标准距离度量时,您最终会得到属性 A 完全压倒属性 B。