定义

将抽象概念进行形象性表达,将抽象的指标、数据进行具象图形可视的过程

分类

信息可视化

包含但不限于零售、金融、教育、制造等行业
利用柱状图、趋势图、扇形图、漏斗图、热点图等,将行业抽象的数据概念转化成为可视化信息,辅助决策和管理
包括内容可视化、报表可视化

图表使用的基本原则

  • 条形图、柱状图

1、条形图、柱状图从零开始
依靠长度来直观的显示判定值的大小和变化趋势,而当基线改变时,这就会扭曲你的视线,给你造成错觉和假象
2、柱状图避免过宽或过窄
注意柱状的宽度和间隔

  • 扇形图、饼图

1、一般来说,使用扇形图的样本类别最好在7个以内,因为饼图是体现数据之间的对比,扇形数量越少,它们的对比就越清晰
2、按照扇形占比进行排序,把数据从12点钟的位置开始排列,最重要的成分紧靠12点钟的位置

  • 线形图、趋势图

选用的线型要相对粗些,线条一般不超过5条,不使用倾斜的标签,纵坐标轴一般刻度从0开始。预测值的线条线型改为虚线

  • 漏斗图
  • 其他

1、尊重整体,但不忽略样本间的关联
所有图表信息无非表达了两种关系:第一,样本A与样本B之间的对比;第二,样本A与总体的关系
2、显示数据区分度
可视化图表的初衷是:更清晰的展示数据背后的规律,所以:在进行数据可视化项目时,我们还是需要秉持“少即是多”的信条,数据有区分度
3、切忌遮盖数据
4、同比呈现数据
5、数据对比更直观
在图表可视化过程中,我们始终要秉持选择合适图表的初衷,让数据对比更明显、趋势更清晰

可视化图表的选用原则

  • 成分

    一般情况下,我们会选择饼图来呈现成分的对比关系

    • 遵循阅读习惯,饼图成分重要性需要呈顺时针顺序
    • 切片数量不要超过7个,其余不那么重要的分支整合归为“其他”项
    • 尽量避免使用立体饼图,除非你真的有信心避免视觉错觉
  • 项类对比

    一般来说,常见的维度对比无外乎数据大小、占比这两类。而就图表类型而言,项类对比最常用图表类型为条形图

    • 符合常识的默认排序(从大到小、从高到低、从好到差),除非你需要遵循其他逻辑排序(比如时间)
    • 条形图间隔<条形图本身宽度
  • 时间序列、频率分布

    时间序列(一条时间线下数据类别、变量的变化)、频率分布通常选取柱形图、折线图两类 建议以8个时间点为区分界限,当时间点>8时,采用折线图,减少视觉对比疲劳,当时间点<8时,选取柱形图 柱状图和折线图的选择还和数据特征有关,当你想凸显特定时间段内产量、销量等数据指标的时间序列变化,用柱状图比较合适,因为它还能够凸显程度、数量;而折线图则更注重变化、变化趋势,在表现数据发展趋势和时间序列预测分析中较为常用

    • 柱状图:柱形图间隔<柱形图本身宽度;堆积柱状图适用于对比多个项目、类别的成分关系,是表达成分对比关系的重要方式,百分比堆积图尽量不要对比每个类项超出3个细分成分,否则会带来对比混乱,堆积柱状图使用有度,避免对比混乱
    • 折线图:最能够直观展示上升、下降、波动、维持原状趋势的图表,它侧重于勾勒变化和变化趋势,用于表达数据的发展趋势,趋势线要突出(颜色、粗细等)
  • 相关性

    相关性分析中,我们常使用散点图直观地显示变量间的相关强度、相关方向,并用于探索性数据分析,做出拟合曲线和回归方程,对未来趋势进行探索性预测

    • 散点、气泡图:散点、气泡大小需要直观

科学可视化

主要是自然科学研究方向比如:物理、化学、气象气候、航空航天、医学、生物学等 利用可视化技术对数据和模型进行解释,旨在寻找其中的模式、特点、关系以及异常情况

可视分析学

综合领域 重点通过交互式视觉界面进行分析推理 如果说信息可视化和科学可视化是面向现在,那么可视分析学预测分析未来 利用可视化技术,基于现有数据池,重在利用可视化分析提出解决方案