← 返回第3章导航

3.4 Stem and Leaf Diagrams

茎叶图 - 数据整理与分布展示的有效工具

一、核心知识点

茎叶图的定义与作用

茎叶图是将数据按"茎(通常为高位部分)"和"叶(通常为低位部分)"拆分,用于整理2或3位有效数字的数据,可直观展示数据分布形状,便于查找众数、四分位数、中位数等。

  • 揭示数据分布形态:直观显示数据的分布形状
  • 方便计算统计量:便于计算四分位数、中位数、众数
  • 数据比较:可通过背靠背茎叶图对比两组数据
  • 异常值识别:快速发现极端值

茎叶图的结构要素

  • 茎(Stem):通常为数据的高位部分(如十位、百位)
  • 叶(Leaf):通常为数据的低位部分(如个位、小数位)
  • Key:说明茎和叶如何组合成原始数据
  • 排序:叶部分按升序排列

二、例题

Example 6

The blood glucose levels of 30 males are recorded. The results, in mmol/litre, are given below.

4.4, 2.4, 5.1, 3.7, 4.7, 2.2, 3.8, 4.2, 5.0, 4.7, 4.1, 4.6, 4.7, 3.7, 3.6, 2.1, 2.5, 3.8, 4.2, 4.0, 3.5, 4.8, 5.1, 4.5, 3.6, 1.4, 3.2, 4.7, 3.6, 5.2

a) Draw a stem and leaf diagram to represent the data.

b) Find: i the mode ii the lower quartile iii the upper quartile iv the median.

解答

a) 绘制茎叶图步骤

  • 步骤1:升序排序数据:1.4, 2.1, 2.2, 2.4, 2.5, 3.2, 3.5, 3.6, 3.6, 3.6, 3.7, 3.7, 3.8, 3.8, 4.0, 4.1, 4.2, 4.2, 4.4, 4.5, 4.6, 4.7, 4.7, 4.7, 4.7, 4.8, 5.0, 5.1, 5.1, 5.2
  • 步骤2:拆分茎(整数部分)和叶(小数部分)

茎叶图

Stem Leaf Key: \( 1 \mid 4 = 1.4 \)
1 4
2 1 2 4 5
3 2 5 6 6 6 7 7 8 8
4 0 1 2 2 4 5 6 7 7 7 7 8
5 0 1 1 2

b) 计算统计量

  • i 众数:4.7(出现次数最多)
  • ii 下四分位数(\( Q_1 \)):位置\( 30/4 = 7.5 \),取第8项,即3.6
  • iii 上四分位数(\( Q_3 \)):位置\( 3×30/4 = 22.5 \),取第23项,即4.7
  • iv 中位数:位置\( 30/2 = 15 \),取第15、16项平均值,即\( (4.0 + 4.1)/2 = 4.05 \)

Example 7

Achara recorded the resting pulse rate for the 16 boys and 23 girls in her year at school. Construct a back to back stem and leaf diagram and comment on the results.

解答

背靠背茎叶图(茎为十位,叶为个位,女孩在左、男孩在右,升序排列):

背靠背茎叶图

Girls Stem Boys Key: \( 0 \mid 4 \mid 6 \) 表示女孩40,男孩46
6 0 6
5 4 0 4 0 7 9
9 5 5 2 1 0 0 4 5 7 8
8 6 6 6 3 2 1 2 4 5
0 2 0 4 5 8 7 0
9 8 5 4 0 8 0
2 1 0 9 1

结论:男孩的静息脉搏率整体低于女孩。

Example 8

The blood glucose levels of 30 females are recorded in the stem and leaf diagram below. An outlier is defined as \( 1.5 \times \text{IQR} \) above \( Q_3 \) or below \( Q_1 \).

女性血糖水平茎叶图

Stem Leaf Key: \( 2 \mid 1 = 2.1 \)
2 2 2 3 3 5 7
3 1 2 6 7 7 7 8 8 8 8 9 9 9
4 0 0 0 0 4 5 6 7 8
5 1 5

a) Find the quartiles. b) Find any outliers.

解答

a) 计算四分位数

  • 下四分位数(\( Q_1 \)):位置\( 30/4 = 7.5 \),取第8项,即3.2
  • 上四分位数(\( Q_3 \)):位置\( 3×30/4 = 22.5 \),取第23项,即4.0
  • 中位数:位置\( 30/2 = 15 \),取第15、16项平均值,即3.8

b) 判断异常值

  • 四分位距(IQR):\( 4.0 - 3.2 = 0.8 \)
  • 异常值下限:\( 3.2 - 1.5×0.8 = 2.0 \)
  • 异常值上限:\( 4.0 + 1.5×0.8 = 5.2 \)
  • 数据中5.5 > 5.2,故5.5是异常值