∑常用公式,西格玛计算公式


∑常用公式,西格玛计算公式

文章插图
统计学:中方差和偏离基准的定义
方差是什么? 电子表格的大小显示了一列 。
每个数据和标准偏差是什么?平均值之间的距离是与标准的偏差 。
在机器学习方差中,我们可以确定单个列的记录是否分散,或者换句话说,是否远离数据集的意义 。
∑常用公式,西格玛计算公式

文章插图
方差计算公式
∑常用公式,西格玛计算公式

文章插图
标准偏差计算公式
在希腊被称为Sigma 。
通过示例计算方差和与标准偏差
我们用一个例子来看一下 。
在这个例子中,引入了几只狗,它们想利用差异来测量狗的状况 。
∑常用公式,西格玛计算公式

文章插图
每只狗离肩(胫骨)的高度分别为600毫米、470毫米、170毫米、430毫米和300毫米 。我们的任务是获取方差、标准差和平均值 。
平均值=(600 470 170 430 300)/5=
平均值=1970/5=
平均值= 395
因此,上图中的平均值如下:
∑常用公式,西格玛计算公式

文章插图
平均视图(绿线表示平均)
现在用平均值计算每只狗的身高差,如下:
∑常用公式,西格玛计算公式

文章插图
每只狗的身高和平均值的差值
现在我们必须计算它们之间的差异:
∑常用公式,西格玛计算公式

文章插图
方差计算方法
现在,如果我们取方差的根,我们把标准差:
/pgc-image/0f5ab822f3af4e6db6485af482b47000" />计算标准偏差
现在我们可以更新我们的形状:

∑常用公式,西格玛计算公式

文章插图
计算狗之间的标准差
现在我们可以轻松确定哪种标准适合我们 。左边的狗不是我们的标准,它们已经高于标准,中间的犬是最矮的狗,也不在我们这个数据集的标准中 。
注意:关键是当方差很小并且接近于零时,这意味着列的记录非常接近平均值并且彼此非常接近 。高方差告诉我们,有多少记录是平均值的支柱,彼此之间相差甚远 。