带加权样本的弹性净回归或套索回归(sklearn)

Elastic net regression or lasso regression with weighted samples (sklearn)

Scikit-learn 允许将样本权重提供给线性、逻辑和岭回归(以及其他),但不允许提供给弹性网络或套索回归。通过样本权重,我的意思是输入的每个元素(以及相应的输出)都具有不同的重要性,并且应该对与其权重成比例的估计系数产生影响。

有没有一种方法可以在将数据传递给 ElasticNet.fit() 以合并我的样本权重之前处理我的数据?

如果不能,是否有根本原因?

谢谢!

您可以在 sklearn 的 issue-tracker 中阅读关于此的一些讨论。

基本上是这样写的:

  • 没那么难(理论上)
  • 保留所有基本的 sklearn'API 并支持所有可能的情况(密集与稀疏)的痛苦

正如您在本帖和 linked one about adaptive lasso 中看到的那样,那里 activity 并不多(可能是因为没有多少人关心,相关论文也不够流行;但这只是一个猜猜)。

根据您的确切任务(大小?稀疏性?),您可以基于 scipy.optimize 轻松构建自己的优化器,支持这种样本权重(这会有点慢,但稳健和精确)!