5.png

0x01描述性度量

  • 集中趋势
  • 离散程度
  • 偏态和峰度

    0x02直方图

    一.绘制

  • 数据分组

  • 统计各组频数和频率
  • 横轴标出每组上下限,纵轴表示频数或频率
  • 每个长条之间没有空隙,区别于柱形图

    二.分类

    1.频数直方图

  • 每条频数*组距=每组数量


数据可视化-5.分布型数据可视化 - 图2

2.频率直方图

  • 每条频率*组距=每组概率
  • 面积与频率

image.png

0x03茎叶图

  • 数据集为整数
  • 数据高位为树茎,低位为树叶
  • 树茎0,树叶3,7,9:存在数据3,7,9
  • 树茎1,树叶456,存在数据:14,15,16

image.png

0x04箱线图

  • 5个特征值
    • 下四分位数
      • 箱子下线
    • 中位数
      • 箱子中间的线
    • 上四分位数
      • 箱子上线
    • 最大值/上内限
      • 箱子上方的线
    • 最小值/下内限
      • 箱子下方的线
  • 位于内限之外:异常值
  • 对比多组数据分布
  • 检测数据异常值或离群点

image.png

0x05概率密度图

  • 连续型随机变量分布规律
  • 概率密度函数
    • 变量的取值概率
    • 取值落在某个区域概率:积分,面积
  • 正态分布

image.png

  • 偏态
    • 左偏分布
      • sk < 0
      • 较正态分布,均值右移,左侧长尾
    • 右偏分布
      • sk > 0
      • 较正态分布,均值左移,右侧长尾

image.png

  • 峰度
    • 扁平分布
      • beta < 3
      • 比正态分布宽矮
    • 尖峰分布
      • beta > 3
      • 比正态分布窄高

image.png

0x06散点图

  • 二维(x,y),多类别

image.png

0x07气泡图

  • 三维(x,y,z),多类别

image.png

0x08热力图

  • 密度函数可视化
  • 热力地图
    • 交通热力,反映路况拥挤程度
  • 网页热力图
    • 用户焦点

image.png

0x09地图

  • 二维,三维
  • 地理信息
    • 国家
    • 省份
    • 城市
    • 行政区
    • 经纬度
  • 导航,天气预报,降水量等

image.png

_