6.2 Finding the Cumulative Distribution Function for a Discrete Random Variable

离散随机变量的累积分布函数

6.2.1 核心概念总结 / Core Concepts Summary

累积分布函数定义:

累积分布函数 \(F(x)\) 定义为随机变量 \(X\) 小于或等于 \(x\) 的概率:

\[F(x) = P(X \leq x)\]

对于离散随机变量,累积分布函数可以表示为概率质量函数的累积和:

\[F(x) = \sum_{k \leq x} P(X = k)\]

累积分布函数的基本性质:

Basic Properties of Cumulative Distribution Function:

  1. 非递减性:当 \(x_1 < x_2\) 时,\(F(x_1) \leq F(x_2)\)。Non-decreasing: When \(x_1 < x_2\), \(F(x_1) \leq F(x_2)\).
  2. 范围性:对所有实数 \(x\),\(0 \leq F(x) \leq 1\)。Boundedness: For all real numbers \(x\), \(0 \leq F(x) \leq 1\).
  3. 极限性质:\(\lim_{x \to -\infty} F(x) = 0\),\(\lim_{x \to +\infty} F(x) = 1\)。Limit Properties: \(\lim_{x \to -\infty} F(x) = 0\), \(\lim_{x \to +\infty} F(x) = 1\).
  4. 右连续性:累积分布函数在每个点都是右连续的。Right-continuity: The cumulative distribution function is right-continuous at every point.

6.2.2 构造方法总结 / Construction Method Summary

从概率质量函数构造累积分布函数的步骤:

Steps for Constructing CDF from PMF:

  1. 确定所有可能取值:列出随机变量能取的所有可能值,通常按升序排列。Identify all possible values: List all possible values that the random variable can take, usually in ascending order.
  2. 计算每个值的概率:使用概率质量函数计算每个可能值的概率。Calculate probability for each value: Use the probability mass function to calculate the probability for each possible value.
  3. 累积求和:从最小的可能值开始,对每个 \(x\) 值,计算所有小于或等于该值的概率之和。Cumulative summation: Starting from the smallest possible value, for each \(x\) value, calculate the sum of probabilities of all values less than or equal to that value.
  4. 定义分段函数:将累积分布函数表示为分段函数的形式。Define piecewise function: Express the cumulative distribution function as a piecewise function.

构造示例 / Construction Example:

对于掷硬币随机变量 \(X\)(取值0,1,2,各概率0.25,0.5,0.25),累积分布函数为:

\[F(x) = \begin{cases} 0 & x < 0 \\ 0.25 & 0 \leq x < 1 \\ 0.75 & 1 \leq x < 2 \\ 1 & x \geq 2 \end{cases}\]

6.2.3 概率计算公式 / Probability Calculation Formulas

1. 基本概率计算

1. Basic Probability Calculation

\[P(X \leq x) = F(x)\]

\[P(X > x) = 1 - F(x)\]

\[P(X < x) = F(x-) = \lim_{t \to x^-} F(t)\]

2. 区间概率计算

2. Interval Probability Calculation

\[P(a < X \leq b) = F(b) - F(a)\]

\[P(a \leq X \leq b) = F(b) - F(a-)\]

\[P(a < X < b) = F(b-) - F(a)\]

注意 / Note:

对于离散随机变量,\(P(X = x) = F(x) - F(x-)\),其中 \(F(x-)\) 表示 \(x\) 处的左极限。

For discrete random variables, \(P(X = x) = F(x) - F(x-)\), where \(F(x-)\) is the left limit at \(x\).

6.2.4 常见分布示例 / Common Distribution Examples

6.2.4.1 两点分布 / Bernoulli-like Distribution

对于两枚硬币实验,累积分布函数如教材示例所示。

6.2.4.2 参数化分布 / Parameterized Distribution

对于形如 \(F(x) = \frac{x + k}{8}\) 的分布,可以通过边界条件求解参数。

\[F(x) = \frac{x + k}{8}, \quad x = 1, 2, 3\]

6.2.5 应用要点总结 / Application Key Points

计算技巧 / Calculation Tips:

  • 累积分布函数是阶梯函数,在可能取值点处跳跃。
    The cumulative distribution function is a step function that jumps at possible values.
  • 利用累积分布函数可以方便地计算各种复杂的概率表达式。
    The cumulative distribution function can be used to easily calculate various complex probability expressions.
  • 对于离散随机变量,不进行插值计算。
    For discrete random variables, do not interpolate.
  • 累积分布函数与生存函数(1 - F(x))互为补集。
    The cumulative distribution function and survival function (1 - F(x)) are complementary.

常见错误提醒 / Common Mistakes Reminder:

  • 不要混淆严格不等式和非严格不等式的概率。
    Do not confuse probabilities of strict and non-strict inequalities.
  • 在计算累积概率时,确保不遗漏任何小于等于x的可能值。
    When calculating cumulative probabilities, ensure no possible values less than or equal to x are missed.
  • 记住离散随机变量累积分布函数的右连续性。
    Remember the right-continuity of the cumulative distribution function for discrete random variables.

6.2.6 思维导图总结 / Mind Map Summary

离散随机变量累积分布函数知识体系:

核心概念 构造方法 性质特点 应用领域
• 累积分布函数定义
• 概率质量函数关系
• 阶梯函数特征
• 确定可能取值
• 计算概率质量
• 累积求和
• 分段函数表示
• 非递减性
• 范围[0,1]
• 极限性质
• 右连续性
• 概率计算
• 风险评估
• 统计检验
• 质量控制