# 样本方差的推导
# 有偏估计和无偏估计
- 有偏估计:由样本值求得的估计值与待估参数的真值之间有系统误差,估计值的期望不是系统的真值
- 无偏估计:估计量的偏差(或偏差函数)是此估计量的期望值与估计参数的真值之差。偏差为零的估计量或决策规则称为无偏的。
我们常见的应用中,样本均值是对总体均值的无偏估计
# 极大似然估计
“似然”用现代的中文来说即“可能性”,因此可称之为“最大可能性估计”,用来求一个样本集的相关概率密度函数的参数。
定义,假设
给定样本观测值
例如,
# 大数定律
大数定理简单来说,指得是某个随机事件在单次试验中可能发生也可能不发生,但在大量重复实验中往往呈现出明显的规律性,即该随机事件发生的频率会向某个常数值收敛,该常数值即为该事件发生的概率。
换个说法就是,样本均值的期望等于总体的均值。
公式化表示为,
定义:设
# 中心极限定理
独立同分布的中心极限定理:设随机变量序列
服从于标准正态分布。
简单来说就是,样本均值服从于期望为总体均值
# 样本方差
给定一组观测数据
从一个连续分布中随机取样得到一组观测值为
因为
由上面的公式可以知道,样本观测值的总体方差的期望不等于随机变量分布的方差,因此样本观测值的总体方差不是随机变量分布方差的无偏估计。
上式左右两边同时乘以
因此能做为总体偏差无偏估计的样本偏差的计算公式为:
为什么分母是
- 1.https://bookdown.org/hezhijian/book/intro.html#section-1.1.3 (opens new window)
- 2.https://www.statlect.com/fundamentals-of-statistics/variance-estimation (opens new window)
- 3.https://amsi.org.au/ESA_Senior_Years/SeniorTopic4/4h/4h_2content_4.html (opens new window)
- 4.https://rpubs.com/sagni2047/proofsamplevariance (opens new window)
协方差矩阵 →