一、核心知识点
(二)分组频率表相关概念
当离散数据量较大或处理连续数据时,会用到分组频率表,需掌握以下概念:
- 类边界(Class Boundaries):用于区分分组的边界值。若数据无间隙(如连续数据),类边界为组的端点;若数据有间隙,类边界是两组上下限的中间值。
- 中点(Midpoint):公式:\(\text{中点} = \frac{\text{组上限} + \text{组下限}}{2}\)(或\(\frac{\text{上类边界} + \text{下类边界}}{2}\))。
- 类宽(Class Width):公式:\(\text{类宽} = \text{上类边界} - \text{下类边界}\)。
二、例题
例题1:判断离散/连续变量 | Example 1: Discrete vs Continuous Variables
题目 | Question:判断下列变量是连续还是离散。| Determine whether the following variables are continuous or discrete.
- a 100米短跑时间
- b 长度
- c 袋子里10分硬币的数量
- d 家庭中男孩的数量
解答
- a 短跑时间:连续(时间可取任意值,如9.1秒、9.08秒等)。
- b 长度:连续(长度可通过测量工具获得任意精度值)。
- c 硬币数量:离散(不能有5.62个硬币,数量是特定整数)。
- d 男孩数量:离散(不能有2.45个男孩,数量是特定整数)。
例题2:分组频率表的类边界、中点与类宽 | Example 2: Class Boundaries, Midpoints and Class Width
题目 | Question:随机抽取女性跑400米的时间,数据用两个表格呈现,完成以下问题:| Randomly sampled women's 400m running times are presented in two tables. Complete the following questions:
- a 写出每个表格第一组的类边界。
- b 计算每个表格第一组的中点和类宽。
| Table 1(时间:秒) |
频数\( f \) |
Table 2(时间:秒) |
频数\( f \) |
| 55-65 |
2 |
55-65 |
2 |
| 65-70 |
25 |
66-70 |
25 |
| 70-75 |
30 |
71-75 |
30 |
| 75-90 |
13 |
76-90 |
13 |
解答
a 类边界:
- Table 1:数据无间隙,类边界为\( 55 \)和\( 65 \)。
- Table 2:数据有间隙(如55-65后是66-70),类边界为\( 54.5 \)和\( 65.5 \)(取两组上下限的中间值)。
b 中点与类宽:
- Table 1:中点:\(\frac{55 + 65}{2} = 60\);类宽:\( 65 - 55 = 10 \)。
- Table 2:中点:\(\frac{54.5 + 65.5}{2} = 60\);类宽:\( 65.5 - 54.5 = 11 \)。
总结
核心要点:数据类型分类的关键是理解定性/定量、离散/连续的区别:
- 定性数据描述属性,定量数据用数值衡量;
- 离散数据取特定值,连续数据可取任意值;
- 分组频率表需要掌握类边界、中点和类宽的计算;
- 类边界处理数据间隙,中点代表组的典型值。
学习价值
掌握数据类型分类是统计学的基础,它为后续的数据分析和统计推断提供了基本框架。通过练习可以培养数据分类能力和统计思维。