将 csv 文件值与均方误差进行比较

Question

我有 2 个 csv 文件，其中一个包含 1 列和 27 行（仅包含数字），我想逐行比较这 2 个 csv 文件，取均方误差并打印每次比较的结果，以便我可以使用 pandas 和 sklearn 计算 end.i 中的平均均方误差，非常感谢任何帮助。提前谢谢你。

import pandas as pd
from sklearn.metrics import mean_squared_error
cars = pd.read_csv('koula.csv')
moto = pd.read_csv('katerina.csv')
print(cars)
print(moto)
for i in range(cars):
    for j in range(moto):
       print(mean_squared_error(cars,moto))

Answer 1

如果您只想计算每一行中的一个值，您应该这样做：

for i in range(len(cars)):
   print(mean_squared_error(cars[i],moto[i]))

如果您的数据集长度相同，则此方法有效。

如果您尝试计算数据集中所有行的误差，只需使用：

print(mean_squared_error(cars.values, moto.values))

这将做与上面相同的事情，但它取所有值的平均值，这会更有用。

最后，如果它们是 pd.Series class 实例，则您不必使用 .values

将 csv 文件值与均方误差进行比较

comparing csv files values with mean squared error

python

mean-square-error