两个不同变量之间的哪个距离函数?

which distance function between two different variables?

计算两个对象之间距离的最佳度量标准是什么?对象由四个参数表示(过程前后两个相同的变量)。

目标是在整个集合中成对分配数据点。此外,每对的数据点应彼此 close/similar。

正态分布和归一化分布:看起来一样,只是轴上的量级不同。

您可以使用任何测量功能。大多数情况下,人们使用欧氏距离,但最佳距离在很大程度上取决于具体情况。否则,您可以随时尝试所有功能,观察哪个最准确。

我建议做的一件事是扩展您的功能(如果您有多个功能)。通过缩放您的特征,您可以决定每个特征在欧几里得公式中有多少"impact"。

如果您有一个功能似乎比另一个功能重要得多,您可以将其缩放到稍大的数字。如果所有特征的权重都相同,则应将它们全部缩小到相同的数字范围,通常是 [-0.5, 0.5].

两点之间并没有真正的 "mahalanobis distance",一些特征缩放可能是您最好的选择。此外,最近邻似乎不是解决此问题的最佳算法。