Skip to content

4.2 假设检验

假设检验是用样本数据对关于总体的某个陈述(假设)做出接受或拒绝的统计决策方法,是量化策略回测中判断信号是否有效的核心工具。


一、基本概念

1.1 原假设与备择假设

  • 原假设 H0H_0:通常代表"无效应"或"默认情况"
  • 备择假设 H1H_1:代表研究者希望证明的结论

常见形式:

  • 双侧检验:H0:θ=θ0H_0: \theta = \theta_0 vs H1:θθ0H_1: \theta \neq \theta_0
  • 右侧检验:H0:θθ0H_0: \theta \le \theta_0 vs H1:θ>θ0H_1: \theta > \theta_0
  • 左侧检验:H0:θθ0H_0: \theta \ge \theta_0 vs H1:θ<θ0H_1: \theta < \theta_0

1.2 两类错误

决策 \ 真实状态H0H_0 为真H1H_1 为真
接受 H0H_0✅ 正确❌ 第二类错误 (β\beta)
拒绝 H0H_0❌ 第一类错误 (α\alpha)✅ 正确(检验功效 1β1-\beta
  • 显著性水平 α\alpha:犯第一类错误的概率(通常取 0.05)
  • 检验功效 1β1-\beta:正确拒绝错误原假设的概率

1.3 p-value

p-value 是在原假设成立下,观察到当前样本结果(或更极端结果)的概率:

p-value<α拒绝 H0 \text{p-value} < \alpha \quad \Rightarrow \quad \text{拒绝 } H_0


二、t 检验

2.1 单样本 t 检验

检验 H0:μ=μ0H_0: \mu = \mu_0 vs H1:μμ0H_1: \mu \neq \mu_0

t=Xˉμ0s/nt(n1) t = \frac{\bar{X} - \mu_0}{s / \sqrt{n}} \sim t(n-1)

2.2 手算示例:基金 Alpha 检验

某量化基金宣称能产生正的月度 alpha。收集 12 个月的超额收益数据(%):

[1.2, 0.8, -0.3, 1.5, 0.6, 2.0, -0.1, 0.9, 1.1, 0.3, 1.7, 0.4]

检验 H0:μ=0H_0: \mu = 0 vs H1:μ>0H_1: \mu > 0(右侧检验,α=0.05\alpha = 0.05)。

第一步:计算样本统计量

月份 ii超额收益 rir_i
11.2
20.8
3-0.3
41.5
50.6
62.0
7-0.1
80.9
91.1
100.3
111.7
120.4

第二步:计算样本均值和标准差

统计量计算结果
ri\sum r_i1.2+0.80.3+1.5+0.6+2.00.1+0.9+1.1+0.3+1.7+0.41.2+0.8-0.3+1.5+0.6+2.0-0.1+0.9+1.1+0.3+1.7+0.410.110.1
rˉ\bar{r}10.1/1210.1 / 120.84170.8417
(rirˉ)2\sum (r_i - \bar{r})^2逐项计算5.81895.8189
ss5.8189/11\sqrt{5.8189 / 11}0.72720.7272
SESE0.7272/120.7272 / \sqrt{12}0.20990.2099

第三步:计算 t 统计量

t=0.841700.2099=4.009 t = \frac{0.8417 - 0}{0.2099} = 4.009

第四步:查找临界值

t0.05(11)=1.796t_{0.05}(11) = 1.796(单侧临界值)

第五步:决策

t=4.009>1.796t = 4.009 > 1.796,拒绝 H0H_0

tt 统计量4.0094.009
临界值 t0.05(11)t_{0.05}(11)1.7961.796
p-valueP(T11>4.009)0.0011P(T_{11} > 4.009) \approx 0.0011
结论✅ 拒绝 H0H_0,基金 alpha 显著为正

2.3 双样本 t 检验

比较两个策略的收益是否有显著差异:

t=Xˉ1Xˉ2s12n1+s22n2 t = \frac{\bar{X}_1 - \bar{X}_2}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}}


三、其他常见检验方法

检验用途检验统计量
z 检验方差已知,大样本均值检验z=(Xˉμ0)/(σ/n)z = (\bar{X}-\mu_0)/(\sigma/\sqrt{n})
双样本 t 检验两独立样本均值比较见上
配对 t 检验同一对象前后对比t=dˉ/(sd/n)t = \bar{d}/(s_d/\sqrt{n})
卡方检验分类变量的独立性χ2=(OE)2/E\chi^2 = \sum(O-E)^2/E
F 检验方差齐性检验F=s12/s22F = s_1^2/s_2^2

Quant Link:因子显著性检验

在量化研究中最经典的假设检验应用——因子是否有效:

  1. Fama-French 三因子模型:对于每个因子(市场、规模、价值),检验其风险溢价是否显著非零
  2. IC(信息系数)检验H0:ρ=0H_0: \rho = 0,检验因子与未来收益的相关性是否显著
  3. 多空组合收益检验:检验做多 top 分位数、做空 bottom 分位数的收益是否显著 > 0
  4. 策略回测:对夏普比率做 t 检验,判断策略收益是否显著优于基准

实操要点:

  • 多重比较问题:同时测试上百个因子时,需用 Bonferroni 校正(调整 α\alpha
  • 数据窥探偏差:反复使用同一数据检验假设会导致过拟合
  • 经济显著性 vs 统计显著性:p < 0.05 不意味策略能赚钱,还需考虑交易成本、滑点

Python 验证

python
import numpy as np
from scipy import stats

# 基金 alpha 单样本 t 检验
alpha = np.array([1.2, 0.8, -0.3, 1.5, 0.6, 2.0, -0.1, 0.9, 1.1, 0.3, 1.7, 0.4])
t_stat, p_value = stats.ttest_1samp(alpha, 0, alternative='greater')
print(f"t 统计量 = {t_stat:.4f}")
print(f"p-value  = {p_value:.4f}")
print(f"结论: {'alpha 显著 > 0' if p_value < 0.05 else '不显著'}")

小结

概念含义量化应用
H0H_0无效应假设因子无预测力、策略无 alpha
α\alpha显著性水平(Type I 错误)误判假因子为真
β\betaType II 错误漏掉真因子
p-value观察到极端结果的概率因子筛选的量化指标
检验功效发现真效应的概率回测长度设计

下一步:继续学习 4.3 方差分析(ANOVA)——比较多个策略的均值差异。

Built with VitePress