求相关系数r的公式
【求相关系数r的公式】在统计学中,相关系数(Correlation Coefficient)是衡量两个变量之间线性关系强度和方向的一个重要指标。其中,皮尔逊相关系数(Pearson Correlation Coefficient)是最常用的一种,用字母“r”表示。通过计算r的值,可以判断两个变量是否具有正相关、负相关或无相关性。
一、相关系数r的定义
相关系数r的取值范围在-1到+1之间:
- r = +1:完全正相关
- r = -1:完全负相关
- r = 0:无线性相关
r的绝对值越大,表示两个变量之间的线性关系越强。
二、相关系数r的计算公式
设两个变量分别为X和Y,有n个样本数据点,其相关系数r的计算公式为:
$$
r = \frac{n\sum xy - (\sum x)(\sum y)}{\sqrt{[n\sum x^2 - (\sum x)^2][n\sum y^2 - (\sum y)^2]}}
$$
其中:
- $ n $ 是样本数量
- $ x $ 和 $ y $ 分别是变量X和Y的观测值
- $ \sum xy $ 是所有x与y乘积之和
- $ \sum x $ 和 $ \sum y $ 是x和y的总和
- $ \sum x^2 $ 和 $ \sum y^2 $ 是x和y平方的总和
三、相关系数r的计算步骤
1. 收集两组变量的数据(X和Y)。
2. 计算每对数据的乘积 $ xy $,并求和得到 $ \sum xy $。
3. 计算X的总和 $ \sum x $ 和Y的总和 $ \sum y $。
4. 计算X的平方和 $ \sum x^2 $ 和Y的平方和 $ \sum y^2 $。
5. 将以上结果代入公式,计算出相关系数r的值。
四、相关系数r的表格示例
| 变量 | X | Y | XY | X² | Y² |
| 1 | 2 | 3 | 6 | 4 | 9 |
| 2 | 4 | 5 | 20 | 16 | 25 |
| 3 | 6 | 7 | 42 | 36 | 49 |
| 4 | 8 | 9 | 72 | 64 | 81 |
| 5 | 10 | 11 | 110 | 100 | 121 |
计算过程:
- $ n = 5 $
- $ \sum x = 2 + 4 + 6 + 8 + 10 = 30 $
- $ \sum y = 3 + 5 + 7 + 9 + 11 = 35 $
- $ \sum xy = 6 + 20 + 42 + 72 + 110 = 250 $
- $ \sum x^2 = 4 + 16 + 36 + 64 + 100 = 220 $
- $ \sum y^2 = 9 + 25 + 49 + 81 + 121 = 285 $
代入公式:
$$
r = \frac{5 \times 250 - (30)(35)}{\sqrt{[5 \times 220 - (30)^2][5 \times 285 - (35)^2]}} = \frac{1250 - 1050}{\sqrt{(1100 - 900)(1425 - 1225)}} = \frac{200}{\sqrt{200 \times 200}} = \frac{200}{200} = 1
$$
因此,该组数据的相关系数为 r = 1,表示完全正相关。
五、总结
相关系数r是评估两个变量之间线性关系的重要工具,其计算涉及多个数据项的累加和乘积。通过合理的数据整理和公式应用,可以快速得出r的值,并据此判断变量间的关系方向和强度。掌握这一方法对于数据分析、经济预测、市场研究等领域都有重要意义。








求相关系数r的公式