积矩相关系数 - 知识点总结
积矩相关系数(Product Moment Correlation Coefficient),又称皮尔逊相关系数(Pearson Correlation Coefficient),是衡量两个连续变量之间线性关系强度和方向的统计量。
通常用符号 r 表示样本相关系数,用 ρ(rho)表示总体相关系数。
积矩相关系数的取值范围在 -1 到 +1 之间,其中 -1 表示完全负相关,+1 表示完全正相关,0 表示无线性相关。
适用于两个连续型变量,且变量应满足双变量正态分布,或至少近似正态分布。
公式 1:基于离均差的形式
\[r = \frac{S_{xy}}{\sqrt{S_{xx} \cdot S_{yy}}}\]
其中:
\[S_{xy} = \sum_{i=1}^{n} (x_i - \bar{x})(y_i - \bar{y})\]
\[S_{xx} = \sum_{i=1}^{n} (x_i - \bar{x})^2\]
\[S_{yy} = \sum_{i=1}^{n} (y_i - \bar{y})^2\]
\(\bar{x}\) 和 \(\bar{y}\) 分别是变量 x 和 y 的平均值,n 是样本量。
公式 2:直接计算形式(更常用)
\[r = \frac{n\sum xy - \sum x \sum y}{\sqrt{[n\sum x^2 - (\sum x)^2][n\sum y^2 - (\sum y)^2]}}\]
| 相关系数值范围 | 中文解释 | 英文解释 |
|---|---|---|
| |r| > 0.9 | 极高相关 | Very high correlation |
| 0.7 < |r| ≤ 0.9 | 高度相关 | High correlation |
| 0.5 < |r| ≤ 0.7 | 中度相关 | Moderate correlation |
| 0.3 < |r| ≤ 0.5 | 低度相关 | Low correlation |
| |r| ≤ 0.3 | 极弱相关或无相关 | Very weak or no correlation |
| 中文术语 | 英文术语 |
|---|---|
| 积矩相关系数 | Product Moment Correlation Coefficient |
| 皮尔逊相关系数 | Pearson Correlation Coefficient |
| 正相关 | Positive Correlation |
| 负相关 | Negative Correlation |
| 完全相关 | Perfect Correlation |
| 线性相关 | Linear Correlation |
| 非线性相关 | Non-linear Correlation |
| 协方差 | Covariance |
| 标准差 | Standard Deviation |
| 样本相关系数 | Sample Correlation Coefficient |