随机变量与其均值的偏离程度 var是方差还是标准差

方差是在概率论和统计方差衡量随机变量或一组数据时离散程度的度量 。概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度 。统计中的方差(样本方差)是每个样本值与全体样本值的平均数之差的平方值的平均数 。在许多实际问题中,研究方差即偏离程度有着重要意义 。
方差是衡量源数据和期望值相差的度量值 。
历史
“方差”(variance)这一词语率先由罗纳德·费雪(Ronald Fisher)在其论文《The Correlation Between Relatives on the Supposition of Mendelian Inheritance》 中提出 。
定义
方差在统计描述和概率分布中各有不同的定义,并有不同的公式 。
在统计描述中,方差用来计算每一个变量(观察值)与总体均数之间的差异 。为避免出现离均差总和为零,离均差平方和受样本含量的影响,统计学采用平均离均差平方和来描述变量的变异程度 。

随机变量与其均值的偏离程度 var是方差还是标准差

文章插图
示例
已知某零件的真实长度为a,现用甲、乙两台仪器各测量10次,将测量结果X用坐标上的点表示 。:
两台仪器的测量结果的均值都是 a。但是用上述结果评价一下两台仪器的优劣,很明显,我们会认为乙仪器的性能更好,因为乙仪器的测量结果集中在均值附近 。
由此可见,研究随机变量与其均值的偏离程度是十分必要的 。那么,用怎样的量去度量这个偏离程度呢?容易看到E[|X-E[X]|]能度量随机变量与其均值E(X)的偏离程度 。但由于上式带有绝对值,运算不方便,通常用量E[(X-E[X])2] 这一数字特征就是方差 。
统计学意义
当数据分布比较分散(即数据在平均数附近波动较大)时,各个数据与平均数的差的平方和较大,方差就较大;当数据分布比较集中时,各个数据与平均数的差的平方和较小 。因此方差越大,数据的波动越大;方差越小,数据的波动就越小 。
样本中各数据与样本平均数的差的平方和的平均数叫做样本方差;样本方差的算术平方根叫做样本标准差 。样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或样本标准差越大,样本数据的波动就越大 。
方差和标准差是测算离散趋势最重要、最常用的指标 。方差是各变量值与其均值离差平方的平均数,它是测算数值型数据离散程度的最重要的方法 。标准差为方差的算术平方根,用S表示 。
【随机变量与其均值的偏离程度 var是方差还是标准差】