卡方计算公式和例题
【卡方计算公式和例题】卡方检验是一种常用的统计方法,用于判断两个分类变量之间是否存在显著关联。它常用于观察频数与理论频数之间的差异是否具有统计学意义。卡方检验的基本思想是通过比较实际观测值与期望值之间的差异来判断变量间的关系。
一、卡方计算公式
卡方统计量(χ²)的计算公式为:
$$
\chi^2 = \sum \frac{(O_i - E_i)^2}{E_i}
$$
其中:
- $ O_i $ 表示第i个单元格的实际观测频数;
- $ E_i $ 表示第i个单元格的理论期望频数;
- Σ 表示对所有单元格求和。
二、卡方检验步骤
1. 建立假设
- H₀:两变量独立
- H₁:两变量不独立
2. 构建列联表
将数据整理成一个二维表格,行表示一个变量,列表示另一个变量。
3. 计算理论频数
理论频数公式为:
$$
E_{ij} = \frac{R_i \times C_j}{N}
$$
其中:
- R_i 是第i行的总频数;
- C_j 是第j列的总频数;
- N 是总样本数。
4. 计算卡方值
使用上述公式计算每个单元格的卡方贡献值,并求和得到总卡方值。
5. 确定自由度和临界值
自由度(df)= (行数 - 1) × (列数 - 1)
6. 进行显著性判断
比较卡方值与临界值,或根据p值判断是否拒绝原假设。
三、例题分析
题目: 某学校调查了不同性别学生对课外活动的兴趣,结果如下表所示。问性别与兴趣是否有关?
| 性别 | 喜欢课外活动 | 不喜欢课外活动 | 合计 |
| 男 | 40 | 10 | 50 |
| 女 | 30 | 20 | 50 |
| 合计 | 70 | 30 | 100 |
1. 计算理论频数
- 男+喜欢:$ \frac{50 \times 70}{100} = 35 $
- 男+不喜欢:$ \frac{50 \times 30}{100} = 15 $
- 女+喜欢:$ \frac{50 \times 70}{100} = 35 $
- 女+不喜欢:$ \frac{50 \times 30}{100} = 15 $
2. 计算卡方值
| 单元格 | 实际值 (O) | 理论值 (E) | (O-E) | (O-E)² | (O-E)²/E |
| 男+喜欢 | 40 | 35 | 5 | 25 | 0.714 |
| 男+不喜欢 | 10 | 15 | -5 | 25 | 1.667 |
| 女+喜欢 | 30 | 35 | -5 | 25 | 0.714 |
| 女+不喜欢 | 20 | 15 | 5 | 25 | 1.667 |
| 合计 | 4.762 |
3. 显著性判断
- 自由度 df = (2-1)(2-1) = 1
- 查卡方分布表,α=0.05时,临界值为3.841
- 计算得 χ² = 4.762 > 3.841,因此拒绝原假设,认为性别与兴趣有关。
四、总结表格
| 项目 | 内容说明 |
| 检验类型 | 卡方检验(独立性检验) |
| 原假设 | 性别与兴趣无关 |
| 备择假设 | 性别与兴趣有关 |
| 卡方公式 | $ \chi^2 = \sum \frac{(O_i - E_i)^2}{E_i} $ |
| 理论频数公式 | $ E_{ij} = \frac{R_i \times C_j}{N} $ |
| 卡方值 | 4.762 |
| 自由度 | 1 |
| 临界值(α=0.05) | 3.841 |
| 结论 | 拒绝原假设,性别与兴趣有关 |
通过以上分析可以看出,卡方检验是一种简单但有效的工具,适用于分类数据的分析。在实际应用中,需注意样本量足够大、理论频数不宜过小等前提条件。








卡方计算公式和例题