Power Query 中的累积二项式分布

Cumulative Binomial Distribution in Power Query

我想在幂查询中做一个累积二项分布。我的数据是:

  1. 员工
  2. 审核已完成
  3. 审核失败

我想知道审计失败率低于 5% 的员工是好人还是幸运儿的概率。例如,如果一名员工接受了 20 次审计,0 次失败,则二项式分布表明真实失败率为 5% 的概率为 36%,因此该员工可能是幸运的。 示例 2,对于一名员工,审计 100 次,失败 1 次,我会计算他们有 0.6% 的机会有 0 次失败,给定 5% 的失败率,3.1% 的机会有 1 次失败,有 3.7% 的累积机会有 1或仅靠运气减少失败。

我是这样做的。

起始数据:

(请注意失败百分比不是员工的失败百分比,它是我们用于二项式计算的目标失败百分比)

M代码:

  #"Added Custom" = Table.AddColumn(#"Changed Type", "s-list", each List.Numbers(0,[fails]+1,1)),
    #"Expanded s-list" = Table.ExpandListColumn(#"Added Custom", "s-list"),
    #"Added Custom1" = Table.AddColumn(#"Expanded s-list", "Binomial Distribution", each Number.Factorial([audits])/(Number.Factorial([audits]-[#"s-list"])*Number.Factorial([#"s-list"]))*Number.Power([#"fail%"],[#"s-list"])*Number.Power(1-[#"fail%"],[audits]-[#"s-list"])),
    #"Grouped Rows" = Table.Group(#"Added Custom1", {"ee", "audits", "fails", "fail%", "binom"}, {{"Binomial Distribution", each List.Sum([Binomial Distribution]), type number}})

说明

第一步使用List.Numbers函数生成一个从0到失败总数的列表

第二步扩展,因此列表中的每个数字都在其自己的行中

第三步为列表中的每个数字添加 non-cumulative 二项式概率

第四步将其备份并总结为累积分布的二项分布