04.0 概述

"Alpha 是真的还是运气？" 这是量化金融中最重要的问题。数理统计给了我们一套严格的流程——从数据出发，量化不确定性，做出可验证的结论。

本章定位

本章是基础层的 最后一环，也是从"数学理论"到"数据分析"的桥梁。

前提：03 概率论（随机变量分布、大数定律等）是所有统计推断的数学基础。例如 t 分布、 $\chi^2$ 分布、F 分布等抽样分布的定义来自 03.2 随机变量与分布
下游：04 的学习为 06 随机过程中的参数估计提供基础，也为 07 信息论中的熵估计提供统计视角

如果说 01–03 是 理论框架，04 就是 实战工具箱。前面的章节回答"世界是什么"，04 回答"我们观察到的数据应该让我们相信什么"。

知识链条

五个小节构成一个 从参数到模型、从静态到动态 的完整链条：

4.1 参数估计
    └── 给定分布假设，如何从数据推断参数？
        MLE：找到使数据出现概率最大的参数
        │
        ▼
4.2 假设检验
    └── 给定参数估计，如何判断"信号"是否统计显著？
        p-value、第一类/第二类错误
        │
        ▼
4.3 方差分析（ANOVA）
    └── 有多个策略/分组，它们的均值是否真不同？
        F 检验：组间方差 vs 组内方差
        │
        ▼
4.4 回归分析
    └── 目标变量 y 如何受多个因子 x 影响？
        OLS、β、R²、Fama-MacBeth
        │
        ▼
4.5 时间序列分析
    └── 数据有先后顺序怎么办？
        自相关、平稳性、ARIMA、协整

核心思想：数据不可能告诉我们"绝对真相"，但统计方法告诉我们"在多大程度上可以相信某个结论"。

量化应用速览

小节	核心概念	量化应用	实战例子
4.1 参数估计	MLE: $\hat{\theta} = \arg\max_\theta \prod_{i=1}^n f(x_i \mid \theta)$ ；置信区间	用 MLE 估计收益率分布参数；GARCH 模型参数估计	MLE 给出 $\hat{\mu} = \bar{R}$ ， $\hat{\sigma}^2 = \frac{1}{n}\sum(R_i - \bar{R})^2$
4.2 假设检验	$H_0$ : $\theta = \theta_0$ vs $H_1$ : $\theta \neq \theta_0$ ，t 统计量	策略 Alpha 是否显著不为零？因子收益率是否显著？	年化 Alpha = 3.2%， $t\text{-stat} = 2.45$ → 在 5% 水平拒绝 $H_0: \alpha=0$
4.3 ANOVA	$F = \frac{\text{组间方差}}{\text{组内方差}}$ ， $F \sim F_{k-1, n-k}$	比较多个交易策略的收益率均值是否相同	将股票按动量因子分 5 组，ANOVA 检验 5 组收益均值是否显著不同
4.4 回归分析	$\hat{\boldsymbol{\beta}} = (X^TX)^{-1}X^T\boldsymbol{y}$ ，CAPM: $R_i - R_f = \alpha + \beta(R_m - R_f) + \varepsilon$	CAPM $\beta$ 估计、Fama-French 因子暴露、Barra 风险模型	CAPM 回归得 $\beta=1.2$ ，市场涨 1% 时该股预期涨 1.2%
4.5 时间序列	AR(1): $X_t = c + \phi X_{t-1} + \varepsilon_t$ ，ADF 检验，协整	动量/反转策略（AR 系数 $\phi$ 的正负）、配对交易（协整）	若 $\hat{\phi} = 0.95$ 且显著小于 1，序列均值回复→适合均值回归策略

学习路径

推荐顺序：4.1 → 4.2 → 4.3 → 4.4 → 4.5（逐节递进，4.3 和 4.4 可交换）
前置知识：03 概率论（尤其是 3.2 随机变量与分布、3.3 期望与方差）；02 线性代数中的矩阵运算（4.4 回归的矩阵形式）
时间预估：4.1（1–2 天）+ 4.2（2 天）+ 4.3（1 天）+ 4.4（2–3 天）+ 4.5（3–4 天）

下一步：至此基础层（01–04）全部完成。可选择进入 05 最优化理论（组合优化）或 06 随机过程（期权定价）。

04.0 概述 ​

本章定位 ​

知识链条 ​

量化应用速览 ​

学习路径 ​

📝 练习

04.0 概述

本章定位

知识链条

量化应用速览

学习路径