发布时间:2025-01-20 02:43:08
标准误差(标准误,SE,Standard Error)是描述统计中心(期望)相对于样本量(或称估计量)标准偏差的概念。原始定义是某个样本量相对于自身统计中心的标准偏差。
考虑到估计量的期望总是通过偏置因子与真值联系起来,描绘统计量自身弥散的标准差通过偏置因子的传递,描绘出相对于真值的误差,这就是“标准误差”。即便无偏估计,统计量仍非真值本身。任何数学操作仅是真值的一种估计,具体的数学操作所得值在真值附近自然散布,需要抽样标准差量化这种散布。为了与样本内部标准差作区分,这种假想的样本之间同一统计量标准差称为标准误差。
均值标准误差(标准误差的特例)会同时受到总体标准差和样本标准差的影响。它描述了重复多次样本抽样后,均值相对于其均值的标准差。均值的理想值等于真值(无偏)。多次抽样的随机性带来离散度,理论上的均值标准差与无限总体标准差或样本统计估计所得的标准差有一定偏置量,影响最终均值的图像。独立同分布的随机变量均值的离散情况服从特定公式。
样本均值的抽样方差与抽样次数无关,而是样本容量的函数,会随着样本容量增大而减小。抽样分布的均值标准误差定义为抽样方差与样本容量的函数。关于高斯分布情况下的一阶展开,估计量遵循“学生分布”。t分布与高斯分布相似但略有不同,随样本大小变化。服从t分布的标准误差使用偏置的样本标准偏差代替真实值进行估计。
均方误差(MSE)是没开根号的误差定义,区别于标准误差。它描述估计量自身弥散方差,与标准误差不同。更多关于数理统计学概念的信息请参阅往期内容。