python 中噪声数据的线性变换

Linear transformation for noisy data in python

我有一个您在下面看到的数据集。数据非常嘈杂,但有一个明显的线性趋势向上和向右。我想用 y = m * x 转换数据以使线条水平。本质上,我想对橙色线进行回归以拉出斜率,但我不知道如何提取不同的线性簇。有没有好的方法可以像这样转换数据?我正在使用 python/pandas/numpy.

您似乎想尝试对橙色点进行聚类。一些聚类方法将处理并行集群。我可能会从 DBSCAN.

开始

有关聚类的更多信息,请查看 the tutorial on this scikit-learn page。你的情况有点像这里第4行:

如果您提供数据,我希望有几个人会看一下。