Z-分数

对数据集中,观测值相对位置的亮度。

03 相对位置的度量 - 图1

几何意义:观测值Xi 与平均数的距离,是标准差的倍数。

异常值检测

经验法则
如果你的数据如果符合正态分布,那么大部分的数据,都与平均数的距离在
三个标准差是之内。如果你的这个观测值与平均数的距离超过了三个标准差,就说明
你是异常值。

切比雪夫定理

与平均数的距离在z个标准差之内的数据值所占比例至少为(1-1/z2),其中z是大于1的任意实数。

切比雪夫的案例

假设某大学有100名学生的考试成绩平均分为70分,标准差为5分。那么有多少学生的
考试成绩在60~80分?

题目转换: 与平均数的距离在两个标准差之内的数据,占整体数据的比例至少是多少呢?

(1-1/2)^2 = 3/4 ,即75%