第五章 相关与回归 - 综合复习
散点图是展示两个连续变量之间关系的图形方法,通过将每对数据点绘制在坐标系中,可以直观地观察变量间的趋势、强度和方向。
线性回归用于建立自变量(x)和因变量(y)之间的线性关系模型。
回归直线方程:\[y = a + bx\]
其中:
最小二乘法是确定回归直线系数的方法,通过最小化实际值与预测值之间的平方误差和来估计参数。
斜率计算公式:\[b = \frac{n\sum xy - \sum x \sum y}{n\sum x^2 - (\sum x)^2}\]
截距计算公式:\[a = \bar{y} - b\bar{x}\]
积矩相关系数(r)用于衡量两个变量之间线性关系的强度和方向,取值范围在-1到1之间。
计算公式:\[r = \frac{n\sum xy - \sum x \sum y}{\sqrt{[n\sum x^2 - (\sum x)^2][n\sum y^2 - (\sum y)^2]}}\]
解释标准:
重要的是要理解,即使两个变量之间存在强烈的相关关系,也不能直接推断它们之间存在因果关系。相关只表示变量间的伴随变化,而因果关系需要通过实验设计和额外证据来确立。