薪资检查的多项式回归

polynomial regression for payroll examination

我在少数客户中担任内部审计师,我的一个客户在不同地点有数千名员工,其中大部分在总部,客户寻求公司控制来监控薪酬

使用回归方法寻找异常值是否有意义, 潜在参数可以是 -years of experience, gender, level/rank 等 我计划检查所有月薪并寻找重要的异常值,因为全球位置之间的差异,只关注总部可能是个好主意 这个想法是针对前几个月的平均值训练模型并针对当前月份进行测试 你认为什么是太多的努力或理论?或者能有很好的机会带来价值?
谢谢

This 回答了您有关要使用的回归方法的问题。只使用来自总部的数据是有意义的,因为添加来自不同地区的数据将需要您添加更多关于一般人口统计数据的数据,您可以避免这种情况以进行概念验证。

谈到问题本身,您需要更好地解释如何定义异常值。您是否正在寻找工资单中的错误?还是您正在寻找收入比同龄人高 more/less 的人?只有弄清楚基本定义后,您才能决定建模框架。

此外,在转向机器学习方法之前,您可能需要先考虑 Grubbs 检验等统计显着性检验(有关检验的更多信息 here)。它们更容易设置并向非从业者解释。