← 返回2.1导航

2.1 Types of Data

数据类型 - 定性数据与定量数据的分类与特征

一、核心知识点

(一)数据类型分类

定性数据(Qualitative):非数值数据,描述事物的属性、类别等。

示例:最喜欢的颜色(如红色、蓝色)、最喜欢的动物(如猫、狗)、学生姓名等。

定量数据(Quantitative):数值型数据,可通过数值衡量。又分为两类:

  • 离散数据(Discrete):在给定范围内取特定值,无小数部分(因实际意义限制,不能拆分)。
  • 连续数据(Continuous):在给定范围内取任意值,数值精度由测量工具决定。

(二)分组频率表相关概念

当离散数据量较大或处理连续数据时,会用到分组频率表,需掌握以下概念:

  1. 类边界(Class Boundaries):用于区分分组的边界值。若数据无间隙(如连续数据),类边界为组的端点;若数据有间隙,类边界是两组上下限的中间值。
  2. 中点(Midpoint):公式:\(\text{中点} = \frac{\text{组上限} + \text{组下限}}{2}\)(或\(\frac{\text{上类边界} + \text{下类边界}}{2}\))。
  3. 类宽(Class Width):公式:\(\text{类宽} = \text{上类边界} - \text{下类边界}\)。

二、例题

例题1:判断离散/连续变量 | Example 1: Discrete vs Continuous Variables

题目 | Question:判断下列变量是连续还是离散。| Determine whether the following variables are continuous or discrete.

  • a 100米短跑时间
  • b 长度
  • c 袋子里10分硬币的数量
  • d 家庭中男孩的数量

解答

  • a 短跑时间:连续(时间可取任意值,如9.1秒、9.08秒等)。
  • b 长度:连续(长度可通过测量工具获得任意精度值)。
  • c 硬币数量:离散(不能有5.62个硬币,数量是特定整数)。
  • d 男孩数量:离散(不能有2.45个男孩,数量是特定整数)。

例题2:分组频率表的类边界、中点与类宽 | Example 2: Class Boundaries, Midpoints and Class Width

题目 | Question:随机抽取女性跑400米的时间,数据用两个表格呈现,完成以下问题:| Randomly sampled women's 400m running times are presented in two tables. Complete the following questions:

  • a 写出每个表格第一组的类边界。
  • b 计算每个表格第一组的中点和类宽。
Table 1(时间:秒) 频数\( f \) Table 2(时间:秒) 频数\( f \)
55-65 2 55-65 2
65-70 25 66-70 25
70-75 30 71-75 30
75-90 13 76-90 13

解答

a 类边界:

  • Table 1:数据无间隙,类边界为\( 55 \)和\( 65 \)。
  • Table 2:数据有间隙(如55-65后是66-70),类边界为\( 54.5 \)和\( 65.5 \)(取两组上下限的中间值)。

b 中点与类宽:

  • Table 1:中点:\(\frac{55 + 65}{2} = 60\);类宽:\( 65 - 55 = 10 \)。
  • Table 2:中点:\(\frac{54.5 + 65.5}{2} = 60\);类宽:\( 65.5 - 54.5 = 11 \)。

三、课堂练习

练习题

  1. 判断下列变量是定性还是定量:
    a. 建筑物的高度
    b. 套头衫的颜色
    c. 排队等待的时间
    d. 鞋码
    e. 学校学生的姓名
  2. 判断下列陈述是否正确:
    a. 苹果的重量是离散数据
    b. 果园树上苹果的数量是离散数据
    c. 火车旅行的时间是连续数据
    d. 收集汽车颜色的数据是定量数据

总结

核心要点:数据类型分类的关键是理解定性/定量、离散/连续的区别:

  • 定性数据描述属性,定量数据用数值衡量;
  • 离散数据取特定值,连续数据可取任意值;
  • 分组频率表需要掌握类边界、中点和类宽的计算;
  • 类边界处理数据间隙,中点代表组的典型值。
学习价值

掌握数据类型分类是统计学的基础,它为后续的数据分析和统计推断提供了基本框架。通过练习可以培养数据分类能力和统计思维。