如何确定有问题的概率百分比

How to decide the probability percentage in question

我有以下问题:

问题的第一部分是说被选中的人是男性的概率是0.44,也就是说男性的数量是25*0.44 = 11,没关系

在第二部分中,被选中的人是1960年以前出生的男性的概率是0.28,是说总人数25人中有0.28人还是男性人数中有0.28人? 我的意思是1960年之前出生的男性人数应该等于250.28 OR 110.28

0,44 = 11 / 25 人是男性。

0,28 = 7 / 25 人为男性且出生于 1960 年之前。

我发现最容易将这类问题想成 contingency tables。 您使用 maxtrix 布局根据两个或多个因素或特征来表示分布,每个因素或特征具有两个或多个类别。 table 可以用概率(比例)或计数来构造,并且根据 table 中的总计数来回切换很容易。 table中的条目是类别的交集,对应于口头描述中的。 table 右边或底部的数字称为边缘,因为它们位于 table 的边缘,并且始终是 table 行的总和或它们出现的列条目。 table 中的总概率(或计数)是通过对所有行和列求和得出的。性别的边际分布将通过对行求和来找到,生日的边际分布将通过对列求和来找到。

据此,您可以推断出下面括号中的条目所指示的其他值。再加上一个条目,无论是性别还是生日的边缘行,您都可以推断地填写整个 table。 (这与自由度的概念有关——在其他信息由总数固定或概率相加为 1 的已知约束确定之前,您可以独立填写多少条信息。)

Probabilities

            Birthday
        < 1960 | >= 1960
   _______________________
G    |         |          |
e  F |         |          | (0.56)
n  __|_________|__________|
d    |         |          |
e  M |   0.28  |  (0.16)  |  0.44
r  __|_________|__________|______
          ?          ?    |  1.00


Counts

            Birthday
        < 1960 | >= 1960
   _______________________
G    |         |          |
e  F |         |          | (14)
n  __|_________|__________|
d    |         |          |
e  M |    7    |    (4)   |  11
r  __|_________|__________|_____
          ?          ?    |  25

Conditional probability 对应于将自己限制在条件中指定的行或列的子集中。如果有人问你生日 < 1960 给定 的概率是多少,性别是男性,即 P{生日 < 1960 | M} 在相对标准的表示法中,您会将注意力限制在 M 行,因此答案将是 7/11 = 0.28/0.44。在计算上,您采用符合条件的 table 条目中的概率或计数,并将它们表示为指定(给定)边际条目的概率或计数的比例。这通常在概率和统计文本中写为 P(A|B) = P(AB)/P(B),其中 AB 是 A 和 B(交集)的集合 shorthand。