5.1 Scatter Diagrams

散点图与相关性分析 - 例题解析

1
散点图绘制与相关性分析
SKILLS ANALYSIS

在一项城市研究中,调查了多个样本区域的人口密度(人/公顷)和距市中心的距离(公里),结果如下:

Area A B C D E F G H I J
Distance (km) 0.6 3.8 2.4 3.0 2.0 1.5 1.8 3.4 4.0 0.9
Population density (people/hectare) 50 22 14 20 33 47 25 8 16 38

a) 绘制散点图表示这些数据。

b) 描述距离和人口密度之间的相关性。

c) 解释你对b部分的回答。

a) 散点图绘制

距离与人口密度散点图

x轴:距离市中心距离(km),y轴:人口密度(人/公顷)

绘制要点: A区域绘制为(0.6, 50),B区域为(3.8, 22),依此类推。确保坐标轴有适当标签和单位,所有10个数据点都正确绘制。

b) 相关性描述
距离与人口密度之间存在强负相关关系
c) 解释
随着距离市中心的距离增加,人口密度总体呈现明显下降趋势。数据点大致分布在一条从左上角到右下角的直线附近,表明两者之间存在较强的负线性相关关系。
2
相关性与因果关系
SKILLS ANALYSIS

Hideko想了解人们的收入与离开教育或培训年龄之间的关系。她让14位朋友填写匿名问卷,并将结果记录在散点图中。

a) 描述散点图显示的相关类型。

Hideko说她的数据支持"接受更多教育导致人们时薪降低"的结论。

b) 给出一个理由说明为什么Hideko的结论可能不成立。

a) 相关类型描述
散点图显示弱负相关关系
b) Hideko结论的问题
Hideko的结论可能不成立,因为离开教育较晚的受访者通常比早离开教育的人工作经验显著更少,这可能是导致结果中收入降低的真正原因,而非教育本身。

关键问题: 相关性不等于因果关系。数据仅显示相关性,不能证明因果关系。此外,样本存在偏差(仅调查朋友),样本量小,可能存在其他混淆变量。