csv 数据集的最适合 Python 的行?

Line of best fit in Python for csv data set?

我正在制作一个非常基本的情节。我有一个如下所示的 csv 数据集:

1,280.6
2,280.2
3,276.6
4,279.6
5,277.4
6,279.4
7,274.2
8,278.2
9,276.4
10,279.4
11,274.6
12,276.2
13,274.4
14,277.8

我正在用 matplotlib 绘制它,如下所示:

import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('dataset.csv', delimiter=',',header=None,names=['x','y'])

plt.plot(df['x'], df['y'], label='',color=current_palette)

plt.xlabel('x')
plt.ylabel('y')
plt.title('Title')
plt.show()

这给出了这个: a pretty graph

根据我的知识和我在此处找到的以前的答案,我知道在绘制给定方程式或范围或类似内容时如何计算最佳拟合线。但是,找到最适合给定数据集的直线的最佳方法是什么?

非常感谢!

为了找到最合适的线,我建议使用 scipy 的 linear regression module

from scipy.stats import linregress
slope, intercept, r_value, p_value, std_err = linregress(df['x'], df['y'])

既然您已经有了斜率和截距,就可以绘制最佳拟合线了。