Power Query 中的累积二项式分布
Cumulative Binomial Distribution in Power Query
我想在幂查询中做一个累积二项分布。我的数据是:
- 员工
- 审核已完成
- 审核失败
我想知道审计失败率低于 5% 的员工是好人还是幸运儿的概率。例如,如果一名员工接受了 20 次审计,0 次失败,则二项式分布表明真实失败率为 5% 的概率为 36%,因此该员工可能是幸运的。
示例 2,对于一名员工,审计 100 次,失败 1 次,我会计算他们有 0.6% 的机会有 0 次失败,给定 5% 的失败率,3.1% 的机会有 1 次失败,有 3.7% 的累积机会有 1或仅靠运气减少失败。
我是这样做的。
起始数据:
(请注意失败百分比不是员工的失败百分比,它是我们用于二项式计算的目标失败百分比)
M代码:
#"Added Custom" = Table.AddColumn(#"Changed Type", "s-list", each List.Numbers(0,[fails]+1,1)),
#"Expanded s-list" = Table.ExpandListColumn(#"Added Custom", "s-list"),
#"Added Custom1" = Table.AddColumn(#"Expanded s-list", "Binomial Distribution", each Number.Factorial([audits])/(Number.Factorial([audits]-[#"s-list"])*Number.Factorial([#"s-list"]))*Number.Power([#"fail%"],[#"s-list"])*Number.Power(1-[#"fail%"],[audits]-[#"s-list"])),
#"Grouped Rows" = Table.Group(#"Added Custom1", {"ee", "audits", "fails", "fail%", "binom"}, {{"Binomial Distribution", each List.Sum([Binomial Distribution]), type number}})
说明
第一步使用List.Numbers函数生成一个从0到失败总数的列表
第二步扩展,因此列表中的每个数字都在其自己的行中
第三步为列表中的每个数字添加 non-cumulative 二项式概率
第四步将其备份并总结为累积分布的二项分布
我想在幂查询中做一个累积二项分布。我的数据是:
- 员工
- 审核已完成
- 审核失败
我想知道审计失败率低于 5% 的员工是好人还是幸运儿的概率。例如,如果一名员工接受了 20 次审计,0 次失败,则二项式分布表明真实失败率为 5% 的概率为 36%,因此该员工可能是幸运的。 示例 2,对于一名员工,审计 100 次,失败 1 次,我会计算他们有 0.6% 的机会有 0 次失败,给定 5% 的失败率,3.1% 的机会有 1 次失败,有 3.7% 的累积机会有 1或仅靠运气减少失败。
我是这样做的。
起始数据:
(请注意失败百分比不是员工的失败百分比,它是我们用于二项式计算的目标失败百分比)
M代码:
#"Added Custom" = Table.AddColumn(#"Changed Type", "s-list", each List.Numbers(0,[fails]+1,1)),
#"Expanded s-list" = Table.ExpandListColumn(#"Added Custom", "s-list"),
#"Added Custom1" = Table.AddColumn(#"Expanded s-list", "Binomial Distribution", each Number.Factorial([audits])/(Number.Factorial([audits]-[#"s-list"])*Number.Factorial([#"s-list"]))*Number.Power([#"fail%"],[#"s-list"])*Number.Power(1-[#"fail%"],[audits]-[#"s-list"])),
#"Grouped Rows" = Table.Group(#"Added Custom1", {"ee", "audits", "fails", "fail%", "binom"}, {{"Binomial Distribution", each List.Sum([Binomial Distribution]), type number}})
说明
第一步使用List.Numbers函数生成一个从0到失败总数的列表
第二步扩展,因此列表中的每个数字都在其自己的行中
第三步为列表中的每个数字添加 non-cumulative 二项式概率
第四步将其备份并总结为累积分布的二项分布