【超几何分布】超几何分布是概率论中一种重要的离散概率分布,用于描述在不放回抽样中,成功事件发生的次数的概率分布。它常用于统计学、质量控制、生物实验等领域,尤其适用于样本容量较小且总体有限的情况。
一、定义与基本概念
超几何分布描述的是:从一个有限总体中不放回地抽取样本时,某一类元素出现的次数的概率分布。
设总体中有 $ N $ 个个体,其中有 $ K $ 个“成功”个体(即我们关注的某类元素),从总体中随机抽取 $ n $ 个样本,其中恰好有 $ k $ 个“成功”个体的概率为:
$$
P(X = k) = \frac{\binom{K}{k} \binom{N - K}{n - k}}{\binom{N}{n}}
$$
其中:
- $ N $:总体数量
- $ K $:成功个体数量
- $ n $:抽取样本数量
- $ k $:抽取样本中成功个体的数量
二、特点总结
特点 | 内容 |
抽样方式 | 不放回抽样 |
总体大小 | 有限 |
样本大小 | 通常小于总体 |
成功概率 | 随着抽样变化而变化 |
应用场景 | 质量检测、彩票、生物实验等 |
三、与二项分布的区别
项目 | 超几何分布 | 二项分布 |
抽样方式 | 不放回 | 放回 |
总体大小 | 有限 | 无限或可视为无限 |
成功概率 | 非恒定 | 恒定 |
适用情况 | 小样本、有限总体 | 大样本、独立事件 |
四、示例说明
假设一个盒子中有 10 个球,其中 4 个是红球,6 个是蓝球。从中随机抽取 3 个球,求抽到 2 个红球的概率。
使用超几何分布公式计算:
$$
P(X = 2) = \frac{\binom{4}{2} \binom{6}{1}}{\binom{10}{3}} = \frac{6 \times 6}{120} = \frac{36}{120} = 0.3
$$
因此,抽到 2 个红球的概率为 30%。
五、表格总结
参数 | 含义 | 公式 |
$ N $ | 总体数量 | — |
$ K $ | 成功个体数 | — |
$ n $ | 抽取样本数 | — |
$ k $ | 抽取中成功次数 | $ P(X = k) = \frac{\binom{K}{k} \binom{N-K}{n-k}}{\binom{N}{n}} $ |
六、应用场景
- 质量控制:检查一批产品中有多少次品。
- 市场调研:从目标人群中抽取样本进行调查。
- 生物学研究:分析某种基因在样本中的分布情况。
- 抽奖系统:计算特定号码被选中的概率。
七、总结
超几何分布在实际问题中具有广泛的应用价值,特别是在处理有限总体和不放回抽样的情况下。与二项分布相比,它更贴近现实中的抽样过程,能够提供更准确的概率估计。理解其原理和应用有助于我们在数据分析和决策过程中做出更科学的判断。