4.1 参数估计
参数估计是用样本数据推断总体分布中未知参数的方法,包括点估计(给出一个具体数值)和区间估计(给出一个置信区间)。
一、点估计
1.1 极大似然估计(MLE)
思想:找到使当前样本出现概率最大的参数值。
假设 ,似然函数为:
MLE 即 。通常最大化对数似然 。
例:Bernoulli 分布的 MLE
抛一枚硬币 10 次,结果:H, T, H, H, T, H, T, H, H, T(H=正面,6次正面)。
设 ,。
求导:
| 步骤 | 计算 | 结果 |
|---|---|---|
| 数据 | 10 次抛掷,6 次正面 | , |
| 似然函数 | — | |
| 对数似然 | — | |
| 导数置零 | ||
| MLE |
1.2 矩估计(Method of Moments)
思想:用样本矩等于总体矩来解参数。
例:对 ,一阶矩 ,二阶矩 。
二、区间估计
2.1 置信区间的基本概念
其中 为置信水平,常用 95%()。
2.2 总体均值 的置信区间(方差已知)
假设 , 已知:
例:某股票日收益率 ,观测 25 天得 ,求 95% CI:
| 参数 | 值 |
|---|---|
| 标准误 | |
| 95% CI |
2.3 总体均值 的置信区间(方差未知)
用样本标准差 代替 ,使用 分布:
例:某策略月收益率样本():(%)。
| 步骤 | 公式 | 结果 |
|---|---|---|
| 样本均值 | ||
| 样本标准差 | ||
| 标准误 | ||
| 查表 | ||
| 95% CI |
三、Qualifiers
| 概念 | 点估计 | 区间估计 |
|---|---|---|
| 输出 | 单一数值 | 一个区间 |
| 不确定性 | 不体现 | 体现置信水平 |
| 例子 | ||
| 使用场景 | 需要具体参数值 | 需要评估精度 |
Quant Link:估计资产期望收益与波动率
在量化金融中,参数估计无处不在:
- 期望收益估计:(样本收益率均值)
- 波动率估计:(样本标准差)
- 夏普比率:,需要同时估计均值和波动率
- 置信区间用于风险管理:VaR 的估计本质上是在估计收益率分布的某个分位数
实践中需要注意:
- 期望收益的估计误差远大于波动率( vs )
- 这就是为什么量化策略更关注波动率建模而非预测方向
- 贝叶斯方法(如 Black-Litterman 模型)通过引入先验信息改进参数估计
Python 验证
python
import numpy as np
from scipy import stats
# Bernoulli MLE
data = np.array([1, 0, 1, 1, 0, 1, 0, 1, 1, 0]) # H=1, T=0
p_hat = data.mean()
print(f"Bernoulli MLE: p̂ = {p_hat}")
# 均值 CI(方差未知)
returns = np.array([2.1, 0.3, 1.8, -0.5, 1.2, 2.5, 0.8, -0.1, 1.6, 0.9, 2.0, 0.5])
n = len(returns)
mean_r = returns.mean()
se = returns.std(ddof=1) / np.sqrt(n)
t_crit = stats.t.ppf(0.975, n-1)
ci = (mean_r - t_crit * se, mean_r + t_crit * se)
print(f"月收益率 95% CI: ({ci[0]:.3f}%, {ci[1]:.3f}%)")小结
| 方法 | 适用场景 | 缺点 |
|---|---|---|
| MLE | 分布已知,大样本 | 可能无显式解 |
| 矩估计 | 矩易计算 | 信息利用率低(忽略高阶矩) |
| 区间 | 方差已知或大样本 | 方差需另估计 |
| 区间 | 方差未知,小样本 | 依赖正态性假设 |
下一步:继续学习 4.2 假设检验——判断参数是否显著。