集中趋势的度量 - 众数、中位数、均值的计算与应用
集中趋势度量:描述数据集中位置的单值,包括众数(Mode)、中位数(Median)、均值(Mean)。
若集合 \(A\)(大小 \(n_1\),均值 \(\bar{x}_1\))与集合 \(B\)(大小 \(n_2\),均值 \(\bar{x}_2\))合并,总均值为:
对于离散数据的频率表,均值公式为 \(\bar{x} = \frac{\sum xf}{\sum f}\)(\(xf\) 为数据值与频率的乘积和,\(\sum f\) 为频率和)。
| 度量 | 适用数据类型 | 优势 | 劣势 |
|---|---|---|---|
| 众数 | 定性/定量 | 反映最常见值,不受极端值影响 | 可能不唯一,或无实际意义 |
| 中位数 | 定量 | 受极端值影响小 | 未利用所有数据信息 |
| 均值 | 定量 | 利用所有数据,反映整体平均 | 受极端值影响大 |
题目 | Question:25个观测的均值是6.4,30个观测的均值是7.2,计算55个观测的总均值。| The mean of 25 observations is 6.4, and the mean of 30 observations is 7.2. Calculate the overall mean of all 55 observations.
使用合并均值公式:
题目 | Question:李伟记录男学生的衬衫领围尺寸,频率表如下:| Li Wei recorded the collar sizes of male students. The frequency table is as follows:
| 领围 \(x\) | 15 | 15.5 | 16 | 16.5 | 17 |
|---|---|---|---|---|---|
| 频率 \(f\) | 3 | 17 | 29 | 34 | 12 |
求:a 众数;b 中位数;c 均值;d 衬衫制造商为何用众数规划生产。
a 众数:16.5(频率34最高)
b 中位数:总频数 \(\sum f = 3+17+29+34+12 = 95\),中间位置为 \(\frac{95+1}{2} = 48\) 位。
累计频率:15(3)、15.5(20)、16(49),故第48位是16,中位数=16。
c 均值:
d 解释:众数是实际存在的领围尺寸,反映最受欢迎的规格,制造商生产该尺寸能满足最多消费者需求。
核心要点:集中趋势度量的关键是理解三种度量的特点和应用场景:
掌握集中趋势度量是描述性统计的基础,它为后续的数据分析和统计推断提供了基本工具。通过练习可以培养数据分析和统计思维。