3.5 大数定律与中心极限定理
大数定律保证样本均值收敛到期望,中心极限定理则描述了收敛的"形状"——正态分布无处不在。
一、大数定律
1.1 弱大数定律(WLLN)
设 独立同分布,,样本均值 。则对任意 :
收敛类型对照表:
| 符号 | 名称 | 含义 |
|---|---|---|
| 依概率收敛 | 随 增大,偏差很大的概率趋近于 0 | |
| 几乎必然收敛 | 随 增大,几乎所有的路径都收敛(比依概率更强) | |
| 依分布收敛 | 分布函数逐点收敛到极限分布 | |
| 收敛 | 均方误差趋近于 0( 时即均方收敛) |
即 依概率收敛到 。
直观理解:样本量越大,样本均值离真实均值远的概率越小。
1.2 强大数定律(SLLN)
与弱大数定律的区别:几乎必然收敛(以概率1收敛),而非仅依概率收敛。
算一个:抛一枚公平硬币(正面=1,反面=0),。抛 次,正面频率 随 增大趋近 0.5。
| 模拟正面次数 | 频率 | |
|---|---|---|
| 10 | 4 | 0.4000 |
| 100 | 47 | 0.4700 |
| 1,000 | 512 | 0.5120 |
| 10,000 | 5,013 | 0.5013 |
| 100,000 | 50,072 | 0.5007 |
| 1,000,000 | 499,842 | 0.4998 |
二、中心极限定理(CLT)
2.1 基本定理
设 独立同分布,,。令 ,则:
即标准化后的样本和收敛到标准正态分布,与 的原始分布无关!
2.2 等价表述
2.3 手算验证——二项分布逼近正态
算一个:抛公平硬币 次,正面次数 。用正态分布近似计算 。
精确二项计算:$$ P(20 \le S_n \le 30) = \sum_{k=20}^{30} \binom{50}{k} (0.5)^{50} $$
正态近似:,
连续性校正后:
| 步骤 | 计算 |
|---|---|
| 标准下限 | |
| 标准上限 | |
| 正态近似 | |
| 查表值 | |
| 近似概率 |
精确二项值 (接近!)✅
三、Python 模拟
python
import numpy as np
import matplotlib.pyplot as plt
# 模拟:从均匀分布 Uniform(0,1) 采样,观察样本均值的分布
np.random.seed(42)
mu, sigma_sq = 0.5, 1/12 # Uniform(0,1) 的期望和方差
n_trials = 10000
for n in [1, 2, 5, 30, 100]:
# 生成 n_trials 个样本,每个样本含 n 个观测值
samples = np.random.uniform(0, 1, size=(n_trials, n))
means = samples.mean(axis=1)
# 标准化
z = (means - mu) / np.sqrt(sigma_sq / n)
# 计算近似正态性:峰度、偏度
from scipy import stats
_, p_value = stats.normaltest(z)
print(f"n = {n:3d}: 样本均值标准差 = {means.std():.4f} "
f"(理论 {np.sqrt(sigma_sq/n):.4f}), "
f"正态性检验 p = {p_value:.4f}")
# 验证大数定律:抛硬币频率收敛
n_max = 10000
coin_flips = np.random.binomial(1, 0.5, n_max)
cumulative_mean = np.cumsum(coin_flips) / np.arange(1, n_max + 1)
print(f"\nn = {n_max} 时正面频率 = {cumulative_mean[-1]:.6f}")
print(f"与理论值 0.5 的差距 = {abs(cumulative_mean[-1] - 0.5):.6f}")运行输出示例:
n = 1: 样本均值标准差 = 0.2888 (理论 0.2887), 正态性检验 p = 0.0000
n = 2: 样本均值标准差 = 0.2041 (理论 0.2041), 正态性检验 p = 0.0000
n = 5: 样本均值标准差 = 0.1289 (理论 0.1291), 正态性检验 p = 0.0000
n = 30: 样本均值标准差 = 0.0526 (理论 0.0527), 正态性检验 p = 0.4395
n = 100: 样本均值标准差 = 0.0289 (理论 0.0289), 正态性检验 p = 0.6175时,均匀分布的样本均值已接近正态; 时几乎无法区分。
Quant Link:蒙特卡洛模拟与组合 VaR蒙特卡洛模拟的核心正是大数定律:通过大量路径模拟,样本均值收敛到期望价格。
组合 VaR:假设组合包含 种资产,日收益率向量 。组合收益率 。在正态假设下:
但实际收益具有厚尾特征,CLT 说明即使不知道单资产收益的精确分布,多样本均值的分布仍趋近正态——这为历史模拟法和半参数法提供了理论支撑。
小结
| 定理 | 收敛类型 | 精确表述 |
|---|---|---|
| 弱大数定律 | 依概率收敛 | |
| 强大数定律 | 几乎必然收敛 | |
| 中心极限定理 | 分布收敛 |
下一步:继续学习 3.6 随机过程入门——将概率论扩展到时间序列,为金融建模做准备。