数据可视化指的是通过可视化来探索数据,与数据挖掘紧密相关,而数据挖掘指的是使用代码探索数据集的规律和关联。
优秀的可视化:使管着明白含义,发现未意识到的规律和意义。
绘制简单的折线图(matplotlib)
修改标签文字和线条粗细:
矫正图形:
使用scatter()绘制散点图并设置其样式:
使用scatter()绘制一系列点:
自动计算数据:
删除数据点的轮廓:
自定义颜色:
使用颜色映射:渐变色突出数据规律
自动保存图表:savefig(‘file_name’)
随机漫步
随机漫步:每次行走都完全是随机的,没有明确的方向,结果是由一系列随机决策决定的。
例如:漂浮在水滴上的花粉不断受到水分子的挤压而在水面上移动,水滴上的分子运动是随机的,因此花粉在水面上的运动犹如随机漫步。
- 创建RandomWalk()类:随机选择前进方向;
- 选择方向:fill_walk()生成漫步包含的点,决定每次漫步的方向;
- 绘制随机漫步图:
- 模拟多次随机漫步:
- 设置随机漫步的样式:颜色、起点、终点、刻度标记、标签……
- 重新绘制起点和终点:
- 隐藏坐标轴
- 增加点数
- 调整尺寸适合屏幕
使用Pygal模拟掷色子
骰子数据集:两枚骰子,出现某些点数的可能性比其他点数大,绘制图形表示哪些点数出现的可能性大
- 创建骰子类
- 掷骰子,观察点数是否在正常范围内
- 分析结果,计算每个点数出现的次数
- 使用频率值绘制直方图
- 同时掷两枚骰子
- 同时掷两个面数不同的骰子