Skip to content

04.0 概述

"Alpha 是真的还是运气?" 这是量化金融中最重要的问题。数理统计给了我们一套严格的流程——从数据出发,量化不确定性,做出可验证的结论。


本章定位

本章是基础层的 最后一环,也是从"数学理论"到"数据分析"的桥梁。

  • 前提:03 概率论(随机变量分布、大数定律等)是所有统计推断的数学基础。例如 t 分布、χ2\chi^2 分布、F 分布等抽样分布的定义来自 03.2 随机变量与分布
  • 下游:04 的学习为 06 随机过程中的参数估计提供基础,也为 07 信息论中的熵估计提供统计视角

如果说 01–03 是 理论框架,04 就是 实战工具箱。前面的章节回答"世界是什么",04 回答"我们观察到的数据应该让我们相信什么"。


知识链条

五个小节构成一个 从参数到模型、从静态到动态 的完整链条:

4.1 参数估计
    └── 给定分布假设,如何从数据推断参数?
        MLE:找到使数据出现概率最大的参数


4.2 假设检验
    └── 给定参数估计,如何判断"信号"是否统计显著?
        p-value、第一类/第二类错误


4.3 方差分析(ANOVA)
    └── 有多个策略/分组,它们的均值是否真不同?
        F 检验:组间方差 vs 组内方差


4.4 回归分析
    └── 目标变量 y 如何受多个因子 x 影响?
        OLS、β、R²、Fama-MacBeth


4.5 时间序列分析
    └── 数据有先后顺序怎么办?
        自相关、平稳性、ARIMA、协整

核心思想:数据不可能告诉我们"绝对真相",但统计方法告诉我们"在多大程度上可以相信某个结论"。


量化应用速览

小节核心概念量化应用实战例子
4.1 参数估计MLE: θ^=argmaxθi=1nf(xiθ)\hat{\theta} = \arg\max_\theta \prod_{i=1}^n f(x_i \mid \theta);置信区间用 MLE 估计收益率分布参数;GARCH 模型参数估计MLE 给出 μ^=Rˉ\hat{\mu} = \bar{R}σ^2=1n(RiRˉ)2\hat{\sigma}^2 = \frac{1}{n}\sum(R_i - \bar{R})^2
4.2 假设检验H0H_0: θ=θ0\theta = \theta_0 vs H1H_1: θθ0\theta \neq \theta_0,t 统计量策略 Alpha 是否显著不为零?因子收益率是否显著?年化 Alpha = 3.2%,t-stat=2.45t\text{-stat} = 2.45 → 在 5% 水平拒绝 H0:α=0H_0: \alpha=0
4.3 ANOVAF=组间方差组内方差F = \frac{\text{组间方差}}{\text{组内方差}}FFk1,nkF \sim F_{k-1, n-k}比较多个交易策略的收益率均值是否相同将股票按动量因子分 5 组,ANOVA 检验 5 组收益均值是否显著不同
4.4 回归分析β^=(XTX)1XTy\hat{\boldsymbol{\beta}} = (X^TX)^{-1}X^T\boldsymbol{y},CAPM: RiRf=α+β(RmRf)+εR_i - R_f = \alpha + \beta(R_m - R_f) + \varepsilonCAPM β\beta 估计、Fama-French 因子暴露、Barra 风险模型CAPM 回归得 β=1.2\beta=1.2,市场涨 1% 时该股预期涨 1.2%
4.5 时间序列AR(1): Xt=c+ϕXt1+εtX_t = c + \phi X_{t-1} + \varepsilon_t,ADF 检验,协整动量/反转策略(AR 系数 ϕ\phi 的正负)、配对交易(协整)ϕ^=0.95\hat{\phi} = 0.95 且显著小于 1,序列均值回复→适合均值回归策略

学习路径

  • 推荐顺序:4.1 → 4.2 → 4.3 → 4.4 → 4.5(逐节递进,4.3 和 4.4 可交换)
  • 前置知识03 概率论(尤其是 3.2 随机变量与分布、3.3 期望与方差);02 线性代数中的矩阵运算(4.4 回归的矩阵形式)
  • 时间预估:4.1(1–2 天)+ 4.2(2 天)+ 4.3(1 天)+ 4.4(2–3 天)+ 4.5(3–4 天)

下一步:至此基础层(01–04)全部完成。可选择进入 05 最优化理论(组合优化)或 06 随机过程(期权定价)。

Built with VitePress