均值

  • 平均数的一般量度

  • 将所有数字加起来,除以数字个数

  1. 求和
    2. 集中趋势的量度 - 图1

  2. 平均值
    2. 集中趋势的量度 - 图2

频数均值

2. 集中趋势的量度 - 图3

  • 2. 集中趋势的量度 - 图4表示每个数字乘以其频数,然后相加

  • 2. 集中趋势的量度 - 图5表示每个数频数相加

异常值

与其他数据格格不入的极高值或者极低值

偏斜数据

当异常值将数据向左或向右“拉”时即产生偏斜数据

中位数均值同偏移的关系

  • 向右偏斜
    2. 集中趋势的量度 - 图6
  • 向左偏斜
    2. 集中趋势的量度 - 图7
  • 对称数椐
    2. 集中趋势的量度 - 图8

中位数

当偏斜数据和异常值使均值产生误导时,我们就需要用其他方式表示典型值。我们可以取中间值,中位数永近处于中间,它是个中间值。

求中位数三步法:

  1. 按顺序排列数字:从最小値排列到最大値。

  2. 如果奇数个数,则中位数为位于中间的数値。位置为2. 集中趋势的量度 - 图9

  3. 如果偶数个数,将两个中间数相加,然后除以2。位置为2. 集中趋势的量度 - 图10

中位数与偏移的关系

2. 集中趋势的量度 - 图11

众数

  • 数据集中的数
  • 出现最频繁的数值
  • 可能不止一个(有个众数:双峰数据)
  • 既能用于数值数据,又能用于类别数据

众数的计算

  • 不同类别的数值或类别找出
  • 列出频数
  • 找出最值