为什么 scipy.optimize.curve_fit() 在拟合函数中使用定义数量的参数表现更好?
Why does scipy.optimize.curve_fit() perform better with a defined number of aruments in fitting function?
我正在尝试将任意长度的多项式函数拟合到某些粒子数据,并且我注意到 curve_fit() 在拟合函数的参数被明确声明而不是未定义时表现得更好提供的参数数量,即
import scipy.optimize as optimize
def fit(x, a, b):
return a + b*x
my_fit = optimize.curve_fit(fit, x_data, y_data)
表现比
好得多
import scipy.optimize as optimize
import numpy as np
def fit(x, *args):
return np.sum([arg * x**i for i, arg in enumerate(args)])
my_fit = optimize.curve_fit(fit, x_data, y_data, p0=[1, 1])
这里是使用我自己的数据时的拟合比较:
Fitting with *args and explicit coefficients comparison
有人对这种行为有任何解释吗?
它实际上是一样的,问题是 fit 的第二个定义不适用于 numpy 数组,因为 np.sum
总是会产生一个数字。只需指定轴即可:
import scipy.optimize as optimize
def fit(x, a, b):
return a + b*x
def fit2(x, *args):
return np.sum([arg * x**i for i, arg in enumerate(args)], axis=0)
x_data = np.linspace(-0.3, 0.3, 200)
y_data = x_data * 1000 + np.random.normal(size=x_data.shape[0], scale=20)
my_fit = optimize.curve_fit(fit, x_data, y_data, p0=[1, 1])
my_fit2 = optimize.curve_fit(fit2, x_data, y_data, p0=[1, 1])
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(15, 5))
ax1.scatter(x_data, y_data, alpha=0.5, color='red')
ax1.plot(x_data, fit(x_data, my_fit[0][0], my_fit[0][1]), color='k')
ax2.scatter(x_data, y_data, alpha=0.5, color='red')
ax2.plot(x_data, fit2(x_data, my_fit2[0][0], my_fit2[0][1]), color='k')
我正在尝试将任意长度的多项式函数拟合到某些粒子数据,并且我注意到 curve_fit() 在拟合函数的参数被明确声明而不是未定义时表现得更好提供的参数数量,即
import scipy.optimize as optimize
def fit(x, a, b):
return a + b*x
my_fit = optimize.curve_fit(fit, x_data, y_data)
表现比
好得多import scipy.optimize as optimize
import numpy as np
def fit(x, *args):
return np.sum([arg * x**i for i, arg in enumerate(args)])
my_fit = optimize.curve_fit(fit, x_data, y_data, p0=[1, 1])
这里是使用我自己的数据时的拟合比较:
Fitting with *args and explicit coefficients comparison
有人对这种行为有任何解释吗?
它实际上是一样的,问题是 fit 的第二个定义不适用于 numpy 数组,因为 np.sum
总是会产生一个数字。只需指定轴即可:
import scipy.optimize as optimize
def fit(x, a, b):
return a + b*x
def fit2(x, *args):
return np.sum([arg * x**i for i, arg in enumerate(args)], axis=0)
x_data = np.linspace(-0.3, 0.3, 200)
y_data = x_data * 1000 + np.random.normal(size=x_data.shape[0], scale=20)
my_fit = optimize.curve_fit(fit, x_data, y_data, p0=[1, 1])
my_fit2 = optimize.curve_fit(fit2, x_data, y_data, p0=[1, 1])
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(15, 5))
ax1.scatter(x_data, y_data, alpha=0.5, color='red')
ax1.plot(x_data, fit(x_data, my_fit[0][0], my_fit[0][1]), color='k')
ax2.scatter(x_data, y_data, alpha=0.5, color='red')
ax2.plot(x_data, fit2(x_data, my_fit2[0][0], my_fit2[0][1]), color='k')