将 csv 文件值与均方误差进行比较

comparing csv files values with mean squared error

我有 2 个 csv 文件,其中一个包含 1 列和 27 行(仅包含数字),我想逐行比较这 2 个 csv 文件,取均方误差并打印每次比较的结果,以便我可以使用 pandas 和 sklearn 计算 end.i 中的平均均方误差,非常感谢任何帮助。提前谢谢你。

import pandas as pd
from sklearn.metrics import mean_squared_error
cars = pd.read_csv('koula.csv')
moto = pd.read_csv('katerina.csv')
print(cars)
print(moto)
for i in range(cars):
    for j in range(moto):
       print(mean_squared_error(cars,moto))

如果您只想计算每一行中的一个值,您应该这样做:

for i in range(len(cars)):
   print(mean_squared_error(cars[i],moto[i]))

如果您的数据集长度相同,则此方法有效。

如果您尝试计算数据集中所有行的误差,只需使用:

print(mean_squared_error(cars.values, moto.values))

这将做与上面相同的事情,但它取所有值的平均值,这会更有用。

最后,如果它们是 pd.Series class 实例,则您不必使用 .values