在 python 的 scikit 模型中优先考虑以后的观察

Prioritize later observations in the scikit models in python

给定以下形式的信息:

target  f3  f2  f1  date
1   3   2   1   01/02/2000
0   6   5   4   02/02/2001
1   9   8   7   04/02/2002
1   12  11  10  06/02/2003
1   15  14  13  08/02/2004
1   18  17  16  09/02/2005
0   21  20  19  11/02/2006
1   24  23  22  13/02/2007
0   27  26  25  15/02/2008
1   30  29  28  16/02/2009
1   33  32  31  18/02/2010
1   36  35  34  20/02/2011
1   39  38  37  22/02/2012
1   42  41  40  23/02/2013
1   45  44  43  25/02/2014

而且我从项目领域知道世界分布更接近后来的观察,但我仍然想从早期的观察中学习。 有一种方法可以在模型分类任务中优先考虑以后的观察结果吗?

是的,通过将 sample_weight 传递给 fit 方法。 查看一些分类器的文档,例如 here or here。 在你的情况下,你会为​​最近的观察分配更高的权重。

this example 中还有 SVM 分类器的简短说明。