Chapter 7 正态分布

统计学核心公式汇总表 - The Normal Distribution

7.1 正态分布 (The Normal Distribution)

正态分布记号

\[ X \sim N(\mu, \sigma^2) \]
其中:\(\mu\) = 均值,\(\sigma^2\) = 方差

正态分布概率密度函数

\[ f(x) = \frac{1}{\sigma\sqrt{2\pi}} e^{-\frac{(x-\mu)^2}{2\sigma^2}} \]
描述正态分布曲线的数学表达式

连续随机变量性质

单点概率:\(P(X = a) = 0\)
区间概率:\(P(a \leq X \leq b) = P(a < X < b)\)
总面积:曲线下总面积 = 1

正态分布特征

对称性:关于均值\(\mu\)对称
单峰性:在\(\mu\)处达到最大值
渐近性:向两侧无限延伸
拐点:在\(\mu \pm \sigma\)处有拐点

经验法则(68-95-99.7法则)

• 约68%的数据位于 \(\mu \pm \sigma\) 范围内:\(P(\mu - \sigma \leq X \leq \mu + \sigma) \approx 0.68\)

• 约95%的数据位于 \(\mu \pm 2\sigma\) 范围内:\(P(\mu - 2\sigma \leq X \leq \mu + 2\sigma) \approx 0.95\)

• 约99.7%的数据位于 \(\mu \pm 3\sigma\) 范围内:\(P(\mu - 3\sigma \leq X \leq \mu + 3\sigma) \approx 0.997\)

7.2 标准正态分布 (Standard Normal Distribution)

标准正态分布记号

\[ Z \sim N(0, 1^2) \]
其中:\(\mu = 0\),\(\sigma^2 = 1\)

标准化公式

\[ Z = \frac{X - \mu}{\sigma} \]
将任意正态分布转换为标准正态分布

逆标准化公式

\[ X = \mu + Z\sigma \]
将标准正态分布转换回原始正态分布

标准正态分布概率密度函数

\[ f(z) = \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}} \]
标准正态分布的概率密度函数

标准正态分布性质

• 关于0对称

• 曲线下总面积为1

• 约68%的面积位于±1标准差范围内

• 约95%的面积位于±2标准差范围内

• 约99.7%的面积位于±3标准差范围内

7.3 概率计算 (Probability Calculations)

基本概率关系

互补概率:\(P(Z > a) = 1 - P(Z \leq a)\)
区间概率:\(P(a < Z < b) = P(Z < b) - P(Z < a)\)
对称性:\(P(Z < -a) = P(Z > a)\)

z值符号判断规则

P(Z < a) > 0.5 → a > 0
P(Z < a) < 0.5 → a < 0
P(Z > a) < 0.5 → a > 0
P(Z > a) > 0.5 → a < 0

常用概率值

P(Z < 0) = 0.5
P(Z < 1) ≈ 0.8413
P(Z < 1.96) ≈ 0.975
P(Z < 2.58) ≈ 0.995

分位数记号

\[ \Phi(a) = P(Z \leq a) \]
\(\Phi(a)\) 表示标准正态分布的累积分布函数

7.4 参数求解 (Finding μ and σ)

求解未知均值μ

步骤:
1. 使用标准化公式:\(Z = \frac{X - \mu}{\sigma}\)
2. 根据概率条件建立方程
3. 查找对应的z值
4. 求解μ值

求解未知标准差σ

步骤:
1. 使用标准化公式:\(Z = \frac{X - \mu}{\sigma}\)
2. 根据概率条件建立方程
3. 查找对应的z值
4. 求解σ值

同时求解μ和σ

需要条件:两个独立的概率条件
方法:建立方程组
步骤:
1. 建立两个方程
2. 查找对应的z值
3. 解方程组

对称性问题

\[ \mu = \frac{a + b}{2} \]
当 \(P(X > a) = P(X < b) = p\) 时
利用对称性快速确定均值位置

参数求解步骤

1. 识别问题类型(求μ、求σ、或同时求两者)

2. 使用标准化公式建立方程

3. 查找对应的z值(使用百分比点表或主表)

4. 求解参数值

5. 验证答案的合理性

实际应用与注意事项

表格使用技巧

主表:给出P(Z < z)的值,z ≥ 0
百分比点表:给出P(Z > z) = p对应的z值
优先使用:百分比点表(专门设计)
对称性:负z值必须使用对称性质

常见错误

符号错误:混淆P(Z < a)和P(Z > a)
对称性错误:忘记对负z值应用对称性
区间计算错误:忘记减去P(Z < a)
表格查找错误:查找错误的z值

验证方法

概率范围:确保概率值在0和1之间
对称性验证:P(-a < Z < a) = 2P(0 < Z < a)
常识检查:结果是否符合实际情况
图表验证:绘制图表验证计算

实际应用领域

质量控制:根据合格率确定生产标准
医学研究:根据疾病分布确定正常值范围
教育评估:根据考试成绩分布确定评分标准
金融风险管理:根据历史数据确定风险参数