scipy curve_fit 系数与预期值不一致(物理相关?)

scipy curve_fit coefficient does not align with expected value (physics relevant?)

我目前正在为我的论文处理实验数据并且 运行 遇到了 scipy curve_fit 的问题。

背景

这是一项 LED 发射研究,以下模型描述了特定 LED 的吸收光谱 composition/wavelength。

型号是这样的:

基本思想是,我们得到了实验数据,我们希望拟合这个方程,以便我们最好地猜测数据的垂直偏移,这是实验中使用的设备的结果。为了获得垂直移动,curve_fit 中使用的函数将采用 a + c * E * np.sqrt(E-bandE) * np.exp(-E*b) 的形式。 bandE/Eg指的是material的带隙能量,将在代码部分提供。 E指光子能量。

我做了什么

我在 pandas 数据框中使用的值,我将其保存为列表供您复制和粘贴(如果需要),

photon_energy = [1.1271378805005456, 1.1169834851807208, 1.1070104183487501, 1.0972138659739825, 1.0875891829391229, 1.0781318856961741, 1.0688376453022415, 1.0597022808124787, 1.0507217530089832, 1.0418921584458825, 1.0332097237921667, 1.0246708004550413, 1.016271859467705, 1.0080094866265041, 0.9998803778633872, 0.9918813348404801, 0.9840092607544446, 0.9762611563390552, 0.9686341160551564, 0.9611253244578295, 0.9537320527312309, 0.9464516553821375, 0.939281567083788, 0.9322192996621053, 0.9252624392168658, 0.918408643370815, 0.9116556386401471, 0.9050012179201461, 0.898443238080145, 0.8919796176623023, 0.885608334679, 0.8793274245039717, 0.8731349778525352, 0.8670291388465735, 0.8610081031601389, 0.8550701162417932, 0.8492134716100002, 0.8434365092180953, 0.8377376138855407, 0.8321152137923491, 0.8265677790337335]
s2c = 1.0711371944297785, 1.0231329828975677, 1.0994106908895496, 1.5121380434280387, 1.4362625879245816, 1.6793735384201034, 1.967376254925342, 2.718958670464331, 2.8657461347457933, 3.2265806746948247, 4.073118384895329, 5.002080377098846, 5.518310980392261, 6.779117609004787, 7.923629188601875, 9.543272102194026, 11.061716095291905, 12.837722885549315, 15.156654004011116, 17.604461138085984, 20.853321055852934, 24.79640344112394, 28.59835938028905, 32.5257456, 37.87676923906976, 42.15321400245093, 46.794297771521705, 56.44267690099888, 61.60473904566305, 70.99822229568558, 77.60736232076566, 84.37513036736146, 92.9038746946938, 107.54475674330527, 117.91910226690293, 137.67481655050688, 158.02001455302846, 176.37334256204952, 195.20886164268876, 215.87011902349641, 240.41535423461914]

合身

bandE = 0.7435616030790153
def exp_fit(E, a, b, c): 
    # return  a + c * E * np.sqrt(E - bandE) * np.exp(-E/0.046)# Eg and k are already defined previously 
    return a + c  * E * np.sqrt(E-bandE) * np.exp(-E*b)

E = np.linspace(np.min(new_df['Photon Energy']), np.max(new_df['Photon Energy']),1000)

popt, pcov = curve_fit(exp_fit, new_df['Photon Energy'], new_df['S2c'],maxfev = 10000, p0=[0,500/23,1e+9]) # best guess of a,b, and c value
plt.plot(new_df['Photon Energy'], new_df['S2c'], 'o', label='S2c')
plt.plot(new_df['Photon Energy'], exp_fit(new_df['Photon Energy'], *popt), '-', label='S2c fit')
plt.ylabel('Emission Intensity (a.u.)')
plt.xlabel('Photon Energy (eV)')
plt.yscale('log')
plt.legend()
plt.show()

这就是我们最终得到的。

out: [1.59739310e+00 2.50268369e+01 9.55186101e+11]

所以在与我一起工作的人长时间讨论之后(我们对 python 或数据科学不是很了解),我们同意除了 a 系数之外的所有东西都非常适合好吧(b 并不重要,因为它将在后面的步骤中明确计算。C 很重要,而且它的数量级似乎正确)。因为它是一个垂直移动,我们期望 a 是一个常数,但曲线因此而发散。

问题

如问题标题和上一段中所述,我们预计 a 约为 5e-4 或在该数量级范围内,但我们得到的东西对于这个来说太大了实验。如果有人精通 scipy 的 curve_fit 功能,请帮助我们!

附加信息,我们过去使用名为 OriginLab 的东西(一个更昂贵的微软 excel),但它的许可证非常昂贵,所以我们正在尝试使用 python 来代替。这种方法在 OriginLab 上确实有效,并且不会导致拟合出现差异,因此我们认为它可能与 curve_fit 使用的算法有关。

显然问题是由于不方便的拟合标准造成的。

LMSE(最小均方误差)可能已在您的软件中实现。如果数据扩展到几十年,这不是一个很好的拟合标准选择。

对于您的数据,建议使用 LMSRE(最小均方相对误差)。

结果对比如下。

注意:与从 1 到 240 的数据范围相比,大约 a=0.0005 的预期值是荒谬的。这将没有任何效果,就像 a=0 一样。可能是尺度或单位混乱?