总离差平方和名词解释
【总离差平方和名词解释】在统计学中,总离差平方和(Total Sum of Squares,简称TSS)是一个重要的概念,常用于回归分析、方差分析(ANOVA)以及数据变异性的衡量。它反映了数据点与整体平均值之间的差异程度,是衡量数据波动性的一个关键指标。
一、总离差平方和的定义
总离差平方和(Total Sum of Squares, TSS) 是指所有观测值与其均值之差的平方和。它表示整个数据集的总变异性,即所有数据点相对于其平均值的偏离程度。
数学表达式为:
$$
TSS = \sum_{i=1}^{n}(y_i - \bar{y})^2
$$
其中:
- $ y_i $ 表示第 $ i $ 个观测值;
- $ \bar{y} $ 表示所有观测值的平均值;
- $ n $ 表示数据的个数。
二、总离差平方和的意义
1. 反映数据总体的变异性:TSS 越大,说明数据点越分散;反之,则说明数据较为集中。
2. 用于评估模型拟合效果:在回归分析中,TSS 是计算决定系数(R²)的基础之一,用来衡量模型对数据变异的解释能力。
3. 与其他平方和配合使用:TSS 可以分解为回归平方和(ESS) 和 残差平方和(RSS),用于分析变量之间的关系。
三、总离差平方和与其他平方和的关系
| 平方和名称 | 英文缩写 | 公式 | 含义说明 |
| 总离差平方和 | TSS | $ \sum (y_i - \bar{y})^2 $ | 所有观测值与平均值的偏差平方和,代表总变异 |
| 回归平方和 | ESS | $ \sum (\hat{y}_i - \bar{y})^2 $ | 模型预测值与平均值的偏差平方和,代表模型解释的变异 |
| 残差平方和 | RSS | $ \sum (y_i - \hat{y}_i)^2 $ | 实际观测值与模型预测值的偏差平方和,代表未被解释的变异 |
四、实际应用举例
假设某班级学生考试成绩如下(单位:分):
80, 85, 90, 75, 95
计算其总离差平方和:
1. 计算平均值:
$$
\bar{y} = \frac{80 + 85 + 90 + 75 + 95}{5} = 85
$$
2. 计算每个数据点与平均值的差的平方:
- $ (80 - 85)^2 = 25 $
- $ (85 - 85)^2 = 0 $
- $ (90 - 85)^2 = 25 $
- $ (75 - 85)^2 = 100 $
- $ (95 - 85)^2 = 100 $
3. 相加得到 TSS:
$$
TSS = 25 + 0 + 25 + 100 + 100 = 250
$$
五、总结
总离差平方和(TSS)是衡量数据整体变异的重要指标,广泛应用于统计建模和数据分析中。通过将 TSS 分解为 ESS 和 RSS,可以更清晰地理解模型对数据的解释能力和误差来源。掌握 TSS 的概念和计算方法,有助于更好地进行数据解读和模型评估。
如需进一步了解回归分析或方差分析中的相关概念,可继续关注后续内容。








总离差平方和名词解释