← 返回第3章导航

3.1 Histograms

直方图知识点总结 - 掌握频率密度与区间频数估算

核心概念总结

1. 直方图的定义与特点

直方图是一种用于展示分组连续数据的统计图表,通过条形的高度(频率密度)和宽度(组宽)来反映数据的分布特征。

关键特点:条形的面积与频率成正比,适用于组距不等的数据展示。

核心公式

频率密度公式

\[\text{频率密度} = \frac{\text{频率}}{\text{组宽}}\]

区间频数估算

\[\text{频数} = \text{频率密度} \times \text{组宽}\]

2. 直方图与条形图的区别

直方图:用于连续数据,条形之间无间隙,面积有意义

条形图:用于离散数据,条形之间有间隙,高度有意义

3. 频率多边形

连接直方图每个条形顶端中点的折线图,用于展示数据分布的整体趋势和形状。

绘制步骤

步骤1:计算频率密度

  • 确定每组的组宽(上限 - 下限)
  • 计算频率密度 = 频率 ÷ 组宽
  • 确保所有计算准确无误

步骤2:绘制坐标轴

  • 横轴:数据变量(如时间、重量等)
  • 纵轴:频率密度
  • 选择合适的刻度范围

步骤3:绘制条形

  • 根据频率密度确定条形高度
  • 根据组宽确定条形宽度
  • 条形之间无间隙

步骤4:添加频率多边形(可选)

  • 找到每个条形顶端的中点
  • 用直线连接这些中点
  • 形成展示分布趋势的折线

应用技巧

1. 区间频数估算

当需要估算某个区间内的频数时:

  • 将区间分解为若干个完整的组
  • 计算每组的面积(频率密度 × 组宽)
  • 将所有面积相加得到总频数

2. 数据分布分析

通过直方图可以分析:

  • 分布形状:对称、偏斜、多峰等
  • 集中趋势:数据的主要集中位置
  • 离散程度:数据的分散情况

3. 常见错误避免

常见错误

  • 忘记计算频率密度,直接用频率作为高度
  • 在条形之间留间隙(应紧密相连)
  • 混淆频率密度和频率的概念

正确做法:始终记住面积与频率成正比,频率密度是核心概念。