← 返回2.2导航

2.2 Measures of Central Tendency

集中趋势的度量 - 众数、中位数、均值的计算与应用

一、关键知识点

1. 核心概念

集中趋势度量:描述数据集中位置的单值,包括众数(Mode)中位数(Median)均值(Mean)

  • 众数:出现频率最高的数值或组别(modal class)。
  • 中位数:数据排序后位于中间位置的数值。
  • 均值:所有数据的算术平均值,公式为 \(\bar{x} = \frac{\sum x}{n}\)(\(\sum x\) 为数据和,\(n\) 为数据个数)。

2. 合并均值公式

若集合 \(A\)(大小 \(n_1\),均值 \(\bar{x}_1\))与集合 \(B\)(大小 \(n_2\),均值 \(\bar{x}_2\))合并,总均值为:

\[ \bar{x} = \frac{n_1\bar{x}_1 + n_2\bar{x}_2}{n_1 + n_2} \]

3. 频率表中均值的计算

对于离散数据的频率表,均值公式为 \(\bar{x} = \frac{\sum xf}{\sum f}\)(\(xf\) 为数据值与频率的乘积和,\(\sum f\) 为频率和)。

4. 适用场景对比

度量 适用数据类型 优势 劣势
众数 定性/定量 反映最常见值,不受极端值影响 可能不唯一,或无实际意义
中位数 定量 受极端值影响小 未利用所有数据信息
均值 定量 利用所有数据,反映整体平均 受极端值影响大

二、例题

例题1:合并均值 | Example 1: Combined Mean

题目 | Question:25个观测的均值是6.4,30个观测的均值是7.2,计算55个观测的总均值。| The mean of 25 observations is 6.4, and the mean of 30 observations is 7.2. Calculate the overall mean of all 55 observations.

解答

使用合并均值公式:

  • 第一组数据和:\(\sum x = 6.4 \times 25 = 160\)
  • 第二组数据和:\(\sum y = 7.2 \times 30 = 216\)
  • 总均值:\(\bar{x} = \frac{160 + 216}{25 + 30} = \frac{376}{55} \approx 6.84\)(3位有效数字)

例题2:频率表中的众数、中位数、均值 | Example 2: Mode, Median, Mean from Frequency Table

题目 | Question:李伟记录男学生的衬衫领围尺寸,频率表如下:| Li Wei recorded the collar sizes of male students. The frequency table is as follows:

领围 \(x\) 15 15.5 16 16.5 17
频率 \(f\) 3 17 29 34 12

求:a 众数;b 中位数;c 均值;d 衬衫制造商为何用众数规划生产。

解答

a 众数:16.5(频率34最高)

b 中位数:总频数 \(\sum f = 3+17+29+34+12 = 95\),中间位置为 \(\frac{95+1}{2} = 48\) 位。

累计频率:15(3)、15.5(20)、16(49),故第48位是16,中位数=16。

c 均值

\[ \bar{x} = \frac{15 \times 3 + 15.5 \times 17 + 16 \times 29 + 16.5 \times 34 + 17 \times 12}{95} = \frac{1537.5}{95} = 16.2 \]

d 解释:众数是实际存在的领围尺寸,反映最受欢迎的规格,制造商生产该尺寸能满足最多消费者需求。

三、课堂练习

练习题

  1. Taha 收集6个数据,\(\sum x = 256.2\)。
    a. 计算均值
    b. 加入数据52后,均值会如何变化?
  2. 吉隆坡五月(\(n=31, \sum v=724000\))和六月(\(n=30, \sum v=632000\))的日平均能见度 \(v\)(米)。
    a. 计算五月和六月的均值
    b. 计算总均值
  3. 工人制作物品的时间(分钟):7,12,10,8,6,8,5,26,11,9。
    a. 求众数
    b. 求均值
    c. 求中位数
    d. 应使用哪个度量?为什么?

总结

核心要点:集中趋势度量的关键是理解三种度量的特点和应用场景:

  • 众数反映最常见值,适用于定性数据和寻找典型值;
  • 中位数不受极端值影响,适用于有异常值的数据;
  • 均值利用所有数据信息,适用于正态分布数据;
  • 频率表中需要掌握累计频率计算中位数的方法;
  • 合并均值公式适用于多个数据集的合并计算。
学习价值

掌握集中趋势度量是描述性统计的基础,它为后续的数据分析和统计推断提供了基本工具。通过练习可以培养数据分析和统计思维。

2.2 Measures of Central Tendency - 教材全解 ← 返回2.2导航

2.2 Measures of Central Tendency

集中趋势的度量 - 众数、中位数、均值的计算与应用

一、关键知识点

1. 核心概念

集中趋势度量:描述数据集中位置的单值,包括众数(Mode)中位数(Median)均值(Mean)

  • 众数:出现频率最高的数值或组别(modal class)。
  • 中位数:数据排序后位于中间位置的数值。
  • 均值:所有数据的算术平均值,公式为 \(\bar{x} = \frac{\sum x}{n}\)(\(\sum x\) 为数据和,\(n\) 为数据个数)。

2. 合并均值公式

若集合 \(A\)(大小 \(n_1\),均值 \(\bar{x}_1\))与集合 \(B\)(大小 \(n_2\),均值 \(\bar{x}_2\))合并,总均值为:

\[ \bar{x} = \frac{n_1\bar{x}_1 + n_2\bar{x}_2}{n_1 + n_2} \]

3. 频率表中均值的计算

对于离散数据的频率表,均值公式为 \(\bar{x} = \frac{\sum xf}{\sum f}\)(\(xf\) 为数据值与频率的乘积和,\(\sum f\) 为频率和)。

4. 适用场景对比

度量 适用数据类型 优势 劣势
众数 定性/定量 反映最常见值,不受极端值影响 可能不唯一,或无实际意义
中位数 定量 受极端值影响小 未利用所有数据信息
均值 定量 利用所有数据,反映整体平均 受极端值影响大

二、例题

例题1:合并均值 | Example 1: Combined Mean

题目 | Question:25个观测的均值是6.4,30个观测的均值是7.2,计算55个观测的总均值。| The mean of 25 observations is 6.4, and the mean of 30 observations is 7.2. Calculate the overall mean of all 55 observations.

解答

使用合并均值公式:

  • 第一组数据和:\(\sum x = 6.4 \times 25 = 160\)
  • 第二组数据和:\(\sum y = 7.2 \times 30 = 216\)
  • 总均值:\(\bar{x} = \frac{160 + 216}{25 + 30} = \frac{376}{55} \approx 6.84\)(3位有效数字)

例题2:频率表中的众数、中位数、均值 | Example 2: Mode, Median, Mean from Frequency Table

题目 | Question:李伟记录男学生的衬衫领围尺寸,频率表如下:| Li Wei recorded the collar sizes of male students. The frequency table is as follows:

领围 \(x\) 15 15.5 16 16.5 17
频率 \(f\) 3 17 29 34 12

求:a 众数;b 中位数;c 均值;d 衬衫制造商为何用众数规划生产。

解答

a 众数:16.5(频率34最高)

b 中位数:总频数 \(\sum f = 3+17+29+34+12 = 95\),中间位置为 \(\frac{95+1}{2} = 48\) 位。

累计频率:15(3)、15.5(20)、16(49),故第48位是16,中位数=16。

c 均值

\[ \bar{x} = \frac{15 \times 3 + 15.5 \times 17 + 16 \times 29 + 16.5 \times 34 + 17 \times 12}{95} = \frac{1537.5}{95} = 16.2 \]

d 解释:众数是实际存在的领围尺寸,反映最受欢迎的规格,制造商生产该尺寸能满足最多消费者需求。

三、课堂练习

练习题

  1. Taha 收集6个数据,\(\sum x = 256.2\)。
    a. 计算均值
    b. 加入数据52后,均值会如何变化?
  2. 吉隆坡五月(\(n=31, \sum v=724000\))和六月(\(n=30, \sum v=632000\))的日平均能见度 \(v\)(米)。
    a. 计算五月和六月的均值
    b. 计算总均值
  3. 工人制作物品的时间(分钟):7,12,10,8,6,8,5,26,11,9。
    a. 求众数
    b. 求均值
    c. 求中位数
    d. 应使用哪个度量?为什么?

总结

核心要点:集中趋势度量的关键是理解三种度量的特点和应用场景:

  • 众数反映最常见值,适用于定性数据和寻找典型值;
  • 中位数不受极端值影响,适用于有异常值的数据;
  • 均值利用所有数据信息,适用于正态分布数据;
  • 频率表中需要掌握累计频率计算中位数的方法;
  • 合并均值公式适用于多个数据集的合并计算。
学习价值

掌握集中趋势度量是描述性统计的基础,它为后续的数据分析和统计推断提供了基本工具。通过练习可以培养数据分析和统计思维。