超几何分布
【超几何分布】一、概述
超几何分布是概率论中一种重要的离散型概率分布,用于描述在不放回抽样过程中,成功事件发生的次数。与二项分布不同,超几何分布适用于有限总体的抽样问题,且每次抽样后样本不被放回,因此各次试验之间不是独立的。
二、基本概念
- 总体:总共有 $ N $ 个元素。
- 成功事件数:在总体中有 $ K $ 个“成功”元素。
- 样本容量:从总体中抽取 $ n $ 个样本。
- 成功样本数:在样本中出现的成功元素数量为 $ X $。
超几何分布的概率质量函数(PMF)为:
$$
P(X = k) = \frac{\binom{K}{k} \binom{N - K}{n - k}}{\binom{N}{n}}
$$
其中,$ k $ 是可能的成功次数,满足 $ \max(0, n - (N - K)) \leq k \leq \min(n, K) $。
三、应用领域
超几何分布在实际中有着广泛的应用,包括但不限于:
- 抽样调查
- 质量控制
- 招聘筛选
- 遗传学研究
- 网络流量分析
四、特点总结
| 特点 | 描述 |
| 适用场景 | 不放回抽样,总体有限 |
| 与二项分布区别 | 二项分布是放回抽样,超几何是不放回 |
| 参数 | 总体大小 $ N $、成功数 $ K $、样本大小 $ n $ |
| 变量范围 | $ X \in [0, n] $,但受 $ K $ 和 $ N-K $ 限制 |
| 概率计算 | 使用组合数进行计算 |
| 应用实例 | 检查产品质量、统计抽样等 |
五、示例说明
假设一个班级有 30 名学生,其中 10 人是女生。现从中随机抽取 5 人,求恰好有 2 名女生的概率。
- $ N = 30 $
- $ K = 10 $
- $ n = 5 $
- $ k = 2 $
代入公式:
$$
P(X = 2) = \frac{\binom{10}{2} \binom{20}{3}}{\binom{30}{5}} = \frac{45 \times 1140}{142506} \approx 0.0357
$$
即,抽到 2 名女生的概率约为 3.57%。
六、总结
超几何分布是一种在有限总体中进行不放回抽样的重要模型,广泛应用于各种实际问题中。其核心在于利用组合数学来计算特定事件发生的概率。与二项分布相比,它更适用于实际情况中的抽样问题,尤其在样本数量较大时更为准确。理解并掌握超几何分布,有助于更好地进行统计推断和数据分析。








超几何分布