将 csv 文件值与均方误差进行比较
comparing csv files values with mean squared error
我有 2 个 csv 文件,其中一个包含 1 列和 27 行(仅包含数字),我想逐行比较这 2 个 csv 文件,取均方误差并打印每次比较的结果,以便我可以使用 pandas 和 sklearn 计算 end.i 中的平均均方误差,非常感谢任何帮助。提前谢谢你。
import pandas as pd
from sklearn.metrics import mean_squared_error
cars = pd.read_csv('koula.csv')
moto = pd.read_csv('katerina.csv')
print(cars)
print(moto)
for i in range(cars):
for j in range(moto):
print(mean_squared_error(cars,moto))
如果您只想计算每一行中的一个值,您应该这样做:
for i in range(len(cars)):
print(mean_squared_error(cars[i],moto[i]))
如果您的数据集长度相同,则此方法有效。
如果您尝试计算数据集中所有行的误差,只需使用:
print(mean_squared_error(cars.values, moto.values))
这将做与上面相同的事情,但它取所有值的平均值,这会更有用。
最后,如果它们是 pd.Series
class 实例,则您不必使用 .values
我有 2 个 csv 文件,其中一个包含 1 列和 27 行(仅包含数字),我想逐行比较这 2 个 csv 文件,取均方误差并打印每次比较的结果,以便我可以使用 pandas 和 sklearn 计算 end.i 中的平均均方误差,非常感谢任何帮助。提前谢谢你。
import pandas as pd
from sklearn.metrics import mean_squared_error
cars = pd.read_csv('koula.csv')
moto = pd.read_csv('katerina.csv')
print(cars)
print(moto)
for i in range(cars):
for j in range(moto):
print(mean_squared_error(cars,moto))
如果您只想计算每一行中的一个值,您应该这样做:
for i in range(len(cars)):
print(mean_squared_error(cars[i],moto[i]))
如果您的数据集长度相同,则此方法有效。
如果您尝试计算数据集中所有行的误差,只需使用:
print(mean_squared_error(cars.values, moto.values))
这将做与上面相同的事情,但它取所有值的平均值,这会更有用。
最后,如果它们是 pd.Series
class 实例,则您不必使用 .values