定义
将抽象概念进行形象性表达,将抽象的指标、数据进行具象图形可视的过程
分类
信息可视化
包含但不限于零售、金融、教育、制造等行业
利用柱状图、趋势图、扇形图、漏斗图、热点图等,将行业抽象的数据概念转化成为可视化信息,辅助决策和管理
包括内容可视化、报表可视化
图表使用的基本原则
- 条形图、柱状图
1、条形图、柱状图从零开始
依靠长度来直观的显示判定值的大小和变化趋势,而当基线改变时,这就会扭曲你的视线,给你造成错觉和假象
2、柱状图避免过宽或过窄
注意柱状的宽度和间隔
- 扇形图、饼图
1、一般来说,使用扇形图的样本类别最好在7个以内,因为饼图是体现数据之间的对比,扇形数量越少,它们的对比就越清晰
2、按照扇形占比进行排序,把数据从12点钟的位置开始排列,最重要的成分紧靠12点钟的位置
- 线形图、趋势图
选用的线型要相对粗些,线条一般不超过5条,不使用倾斜的标签,纵坐标轴一般刻度从0开始。预测值的线条线型改为虚线
- 漏斗图
- 其他
1、尊重整体,但不忽略样本间的关联
所有图表信息无非表达了两种关系:第一,样本A与样本B之间的对比;第二,样本A与总体的关系
2、显示数据区分度
可视化图表的初衷是:更清晰的展示数据背后的规律,所以:在进行数据可视化项目时,我们还是需要秉持“少即是多”的信条,数据有区分度
3、切忌遮盖数据
4、同比呈现数据
5、数据对比更直观
在图表可视化过程中,我们始终要秉持选择合适图表的初衷,让数据对比更明显、趋势更清晰
可视化图表的选用原则
成分
一般情况下,我们会选择饼图来呈现成分的对比关系
- 遵循阅读习惯,饼图成分重要性需要呈顺时针顺序
- 切片数量不要超过7个,其余不那么重要的分支整合归为“其他”项
- 尽量避免使用立体饼图,除非你真的有信心避免视觉错觉
项类对比
一般来说,常见的维度对比无外乎数据大小、占比这两类。而就图表类型而言,项类对比最常用图表类型为条形图
- 符合常识的默认排序(从大到小、从高到低、从好到差),除非你需要遵循其他逻辑排序(比如时间)
- 条形图间隔<条形图本身宽度
时间序列、频率分布
时间序列(一条时间线下数据类别、变量的变化)、频率分布通常选取柱形图、折线图两类 建议以8个时间点为区分界限,当时间点>8时,采用折线图,减少视觉对比疲劳,当时间点<8时,选取柱形图 柱状图和折线图的选择还和数据特征有关,当你想凸显特定时间段内产量、销量等数据指标的时间序列变化,用柱状图比较合适,因为它还能够凸显程度、数量;而折线图则更注重变化、变化趋势,在表现数据发展趋势和时间序列预测分析中较为常用
- 柱状图:柱形图间隔<柱形图本身宽度;堆积柱状图适用于对比多个项目、类别的成分关系,是表达成分对比关系的重要方式,百分比堆积图尽量不要对比每个类项超出3个细分成分,否则会带来对比混乱,堆积柱状图使用有度,避免对比混乱
- 折线图:最能够直观展示上升、下降、波动、维持原状趋势的图表,它侧重于勾勒变化和变化趋势,用于表达数据的发展趋势,趋势线要突出(颜色、粗细等)
相关性
相关性分析中,我们常使用散点图直观地显示变量间的相关强度、相关方向,并用于探索性数据分析,做出拟合曲线和回归方程,对未来趋势进行探索性预测
- 散点、气泡图:散点、气泡大小需要直观
科学可视化
主要是自然科学研究方向比如:物理、化学、气象气候、航空航天、医学、生物学等 利用可视化技术对数据和模型进行解释,旨在寻找其中的模式、特点、关系以及异常情况
可视分析学
综合领域 重点通过交互式视觉界面进行分析推理 如果说信息可视化和科学可视化是面向现在,那么可视分析学预测分析未来 利用可视化技术,基于现有数据池,重在利用可视化分析提出解决方案