超几何分布与正态分布区别

超几何分布与正态分布的主要区别在于它们适用的场景、参数定义和形状特性。
1. 适用场景:
超几何分布适用于有限样本的抽样问题,特别是当抽样是不放回的情况下,用来计算特定比例的事件在样本中出现的概率。
正态分布适用于大样本或无限总体的情况,描述了数据的平均值附近的概率分布。
2. 参数定义:
超几何分布的参数包括总体大小 \(N\)、成功类别的数量 \(K\) 和样本大小 \(n\)。其概率质量函数为 \(P(X = k) = \frac{{\binom{K}{k} \binom{N-K}{n-k}}}{{\binom{N}{n}}}\),其中 \(k\) 是样本中成功的次数。
正态分布的参数是均值 \(\mu\) 和标准差 \(\sigma\)。其概率密度函数为 \(f(x) = \frac{1}{\sigma\sqrt{2\pi}} e^{-\frac{(x-\mu)^2}{2\sigma^2}}\)。
3. 形状特性:
超几何分布的形状依赖于 \(N\)、\(K\) 和 \(n\) 的值,通常不是对称的,且随着样本大小的增加,其形状会逐渐接近正态分布。
正态分布总是对称的,其峰值位于均值 \(\mu\) 处,两侧的尾部逐渐衰减。
总结来说,超几何分布和正态分布是两种不同的概率分布,各自适用于不同的数据集和统计推断场景。