在 python 的 scikit 模型中优先考虑以后的观察
Prioritize later observations in the scikit models in python
给定以下形式的信息:
target f3 f2 f1 date
1 3 2 1 01/02/2000
0 6 5 4 02/02/2001
1 9 8 7 04/02/2002
1 12 11 10 06/02/2003
1 15 14 13 08/02/2004
1 18 17 16 09/02/2005
0 21 20 19 11/02/2006
1 24 23 22 13/02/2007
0 27 26 25 15/02/2008
1 30 29 28 16/02/2009
1 33 32 31 18/02/2010
1 36 35 34 20/02/2011
1 39 38 37 22/02/2012
1 42 41 40 23/02/2013
1 45 44 43 25/02/2014
而且我从项目领域知道世界分布更接近后来的观察,但我仍然想从早期的观察中学习。
有一种方法可以在模型分类任务中优先考虑以后的观察结果吗?
是的,通过将 sample_weight
传递给 fit
方法。
查看一些分类器的文档,例如
here or here。
在你的情况下,你会为最近的观察分配更高的权重。
this example 中还有 SVM 分类器的简短说明。
给定以下形式的信息:
target f3 f2 f1 date
1 3 2 1 01/02/2000
0 6 5 4 02/02/2001
1 9 8 7 04/02/2002
1 12 11 10 06/02/2003
1 15 14 13 08/02/2004
1 18 17 16 09/02/2005
0 21 20 19 11/02/2006
1 24 23 22 13/02/2007
0 27 26 25 15/02/2008
1 30 29 28 16/02/2009
1 33 32 31 18/02/2010
1 36 35 34 20/02/2011
1 39 38 37 22/02/2012
1 42 41 40 23/02/2013
1 45 44 43 25/02/2014
而且我从项目领域知道世界分布更接近后来的观察,但我仍然想从早期的观察中学习。 有一种方法可以在模型分类任务中优先考虑以后的观察结果吗?
是的,通过将 sample_weight
传递给 fit
方法。
查看一些分类器的文档,例如
here or here。
在你的情况下,你会为最近的观察分配更高的权重。
this example 中还有 SVM 分类器的简短说明。