04.0 概述
"Alpha 是真的还是运气?" 这是量化金融中最重要的问题。数理统计给了我们一套严格的流程——从数据出发,量化不确定性,做出可验证的结论。
本章定位
本章是基础层的 最后一环,也是从"数学理论"到"数据分析"的桥梁。
- 前提:03 概率论(随机变量分布、大数定律等)是所有统计推断的数学基础。例如 t 分布、 分布、F 分布等抽样分布的定义来自 03.2 随机变量与分布
- 下游:04 的学习为 06 随机过程中的参数估计提供基础,也为 07 信息论中的熵估计提供统计视角
如果说 01–03 是 理论框架,04 就是 实战工具箱。前面的章节回答"世界是什么",04 回答"我们观察到的数据应该让我们相信什么"。
知识链条
五个小节构成一个 从参数到模型、从静态到动态 的完整链条:
4.1 参数估计
└── 给定分布假设,如何从数据推断参数?
MLE:找到使数据出现概率最大的参数
│
▼
4.2 假设检验
└── 给定参数估计,如何判断"信号"是否统计显著?
p-value、第一类/第二类错误
│
▼
4.3 方差分析(ANOVA)
└── 有多个策略/分组,它们的均值是否真不同?
F 检验:组间方差 vs 组内方差
│
▼
4.4 回归分析
└── 目标变量 y 如何受多个因子 x 影响?
OLS、β、R²、Fama-MacBeth
│
▼
4.5 时间序列分析
└── 数据有先后顺序怎么办?
自相关、平稳性、ARIMA、协整核心思想:数据不可能告诉我们"绝对真相",但统计方法告诉我们"在多大程度上可以相信某个结论"。
量化应用速览
| 小节 | 核心概念 | 量化应用 | 实战例子 |
|---|---|---|---|
| 4.1 参数估计 | MLE: ;置信区间 | 用 MLE 估计收益率分布参数;GARCH 模型参数估计 | MLE 给出 , |
| 4.2 假设检验 | : vs : ,t 统计量 | 策略 Alpha 是否显著不为零?因子收益率是否显著? | 年化 Alpha = 3.2%, → 在 5% 水平拒绝 |
| 4.3 ANOVA | , | 比较多个交易策略的收益率均值是否相同 | 将股票按动量因子分 5 组,ANOVA 检验 5 组收益均值是否显著不同 |
| 4.4 回归分析 | ,CAPM: | CAPM 估计、Fama-French 因子暴露、Barra 风险模型 | CAPM 回归得 ,市场涨 1% 时该股预期涨 1.2% |
| 4.5 时间序列 | AR(1): ,ADF 检验,协整 | 动量/反转策略(AR 系数 的正负)、配对交易(协整) | 若 且显著小于 1,序列均值回复→适合均值回归策略 |
学习路径
- 推荐顺序:4.1 → 4.2 → 4.3 → 4.4 → 4.5(逐节递进,4.3 和 4.4 可交换)
- 前置知识:03 概率论(尤其是 3.2 随机变量与分布、3.3 期望与方差);02 线性代数中的矩阵运算(4.4 回归的矩阵形式)
- 时间预估:4.1(1–2 天)+ 4.2(2 天)+ 4.3(1 天)+ 4.4(2–3 天)+ 4.5(3–4 天)