均值
平均数的一般量度
将所有数字加起来,除以数字个数
求和
平均值
频数均值
表示每个数字乘以其频数,然后相加
表示每个数频数相加
异常值
与其他数据格格不入的极高值或者极低值
偏斜数据
当异常值将数据向左或向右“拉”时即产生偏斜数据
中位数均值同偏移的关系
- 向右偏斜
- 向左偏斜
- 对称数椐
中位数
当偏斜数据和异常值使均值产生误导时,我们就需要用其他方式表示典型值。我们可以取中间值,中位数永近处于中间,它是个中间值。
求中位数三步法:
按顺序排列数字:从最小値排列到最大値。
如果奇数个数,则中位数为位于中间的数値。位置为
如果偶数个数,将两个中间数相加,然后除以2。位置为
中位数与偏移的关系:
众数
- 数据集中的数
- 出现最频繁的数值
- 可能不止一个(有个众数:双峰数据)
- 既能用于数值数据,又能用于类别数据
众数的计算
- 不同类别的数值或类别找出
- 列出频数
- 找出最值