数据可视化指的是通过可视化来探索数据,与数据挖掘紧密相关,而数据挖掘指的是使用代码探索数据集的规律和关联。
优秀的可视化:使管着明白含义,发现未意识到的规律和意义。

绘制简单的折线图(matplotlib)

修改标签文字和线条粗细:
矫正图形:
使用scatter()绘制散点图并设置其样式:
使用scatter()绘制一系列点:
自动计算数据:
删除数据点的轮廓:
自定义颜色:
使用颜色映射:渐变色突出数据规律
自动保存图表:savefig(‘file_name’)

随机漫步

随机漫步:每次行走都完全是随机的,没有明确的方向,结果是由一系列随机决策决定的。
例如:漂浮在水滴上的花粉不断受到水分子的挤压而在水面上移动,水滴上的分子运动是随机的,因此花粉在水面上的运动犹如随机漫步。

  1. 创建RandomWalk()类:随机选择前进方向;
  2. 选择方向:fill_walk()生成漫步包含的点,决定每次漫步的方向;
  3. 绘制随机漫步图:
  4. 模拟多次随机漫步:
  5. 设置随机漫步的样式:颜色、起点、终点、刻度标记、标签……
  6. 重新绘制起点和终点:
  7. 隐藏坐标轴
  8. 增加点数
  9. 调整尺寸适合屏幕

使用Pygal模拟掷色子

骰子数据集:两枚骰子,出现某些点数的可能性比其他点数大,绘制图形表示哪些点数出现的可能性大

  1. 创建骰子类
  2. 掷骰子,观察点数是否在正常范围内
  3. 分析结果,计算每个点数出现的次数
  4. 使用频率值绘制直方图
  5. 同时掷两枚骰子
  6. 同时掷两个面数不同的骰子