信息图表需要经历⽆数次推敲，才能更好得传递信息，全⽂13000字左右，阅读时⻓30分钟图表是数据可视化的常⽤表现形式，是对数据的⼆次加⼯，可以帮助我们理解数据、洞悉数据背后的真相，让我们更好地适应这个数据驱动的世界。⽆论在⼯作汇报、产品设计、后台设计以及数据⼤屏中都能看到它的身影。然⽽，在实际⼯作中我发现很多初⼊⾏的设计师对于图表设计并不是很了解，同时市⾯上对于这⽅⾯的资料相对零散，不成体系。所以我结合了平时⼯作中的理解，梳理了这篇⽂章，希望能帮助到⼤家。

⼀、图表的组成

1.图表的构成

当我们把图表的结构进⾏拆解后，就会发现⼀个图表是由很多个细⼩构件组成的，这些构件有⾃⼰的名字和⽤途，分别是标题、轴、图形、图例、标签、提示信息。在平常使⽤的过程中，会根据场景去修饰删减⼀些构件元素，以此来减少冗余信息，⽤最适量的数据墨⽔⽐（Data-ink Ratio），帮助⽤户快速达成⽬标，在最少的时间内获取更多的信息。

标题 - 描述图表的主题（包含主标题和副标题）
标签 - 对当前这⼀组数据进⾏的内容标注
轴 - ⽤来定义坐标系中数据在⽅向和值的映射关系
图例 - 对图形本身的概括
提示信息 - 当tap或者hover的时候，以交互提示信息的形式展示该点的数据详情
图形 - 统计图表的视觉通道在形状上映射的视觉展现

接下来，我会⼀点⼀点地为⼤家讲解它们，⽅便⼤家合理的使⽤它们。但在此之前，我们先来了解⼀个知识点 - 数据墨⽔⽐，以便更好的理解接下来的内容。

2. 数据墨⽔⽐

数据墨⽔⽐——“data-ink ratio”，是1983年视觉⼤师爱德华·塔夫特（Edward Tufte）在《The Visual Display of Quantitative Information》中提出的⼀个概念：⼀幅图表的绝⼤部分笔墨应该⽤于展示数据信息，数据变化则笔墨也变化。他将数据油墨⽐定义为图表中⽤于数据的墨⽔量除以总油墨量。其中数据墨⽔指的是图表中不可删除的核⼼内容。⽐如，我可以删除图例、删除坐标轴、删除⽹格线，这可能不会影响你从图表中读取相关的信息。但如果我删除柱形图、饼图这些图表的主体元素，那么图表就失去所要表达的内容了。

我个⼈更喜欢⽤“信噪⽐”= 信号/(信号+噪⾳) 这个概念去理解，因为通过可视化传达的信息不仅仅是数据，还有业务洞察，像观点、结论性的信息往往需要⽤⽂字来呈现的也是⾄关重要。不过⽆论使⽤哪个词，最终的⽬的都是突出传达“信息”部分，去除那些⼲扰的“噪⾳”。

因此，图表中的数据墨⽔占⽐越多，那么该图表的冗余信息就越少，信息传递效果就越好。所以，在创建图表和图形时，我们的⽬标应该是在合理范围内最⼤化数据墨⽔⽐。

⼆、图表元素详解

1.标题

⼀个明确、相符的标题可以迅速让读者理解图表要表达的内容。通常图表的标题是根据图表所需要表达的内容决定的，⼤多数⼩伙伴可能认为命名没有太多问题。但当这个图表的结论是单⼀且唯⼀的时候，建议在概括图表内容的标题中加⼊结论性的信息点。这样能减少读者误解你的意图的可能，⽽且能够确保他们将注意⼒集中于你想着重强调的数据上。

2. 轴（坐标轴）

2.1 定义

轴是能够使每个数组在维度空间内找到映射关系的定位系统，更偏向数学/物理概念。换句话说，轴的功能像是把可视化对象置于共同的基准上，再以标尺进行数值量测。在数据可视化中，一般存在于笛卡尔坐标系（直角坐标系）和极坐标系中。对轴进行「原子」要素的拆分，我们可以得到以下几种元素，分别为：轴线、轴刻度线、轴标签、轴标题（单位）以及网格线。

2.2 分类

根据对应变量是连续数据还是离散数据，轴可以分为：分类轴，时间轴，连续轴。

2.3 使⽤建议

2.3.1 轴线

轴线⼀般只考虑是否显示，结合上⾯所讲的数据墨⽔⽐，在有⽹格线的情况下，柱状图/折线图会隐藏 y 轴线，条形图则是隐藏 x 轴线，以达到信息降噪，突出视觉重点的⽬的。

2.3.2 轴刻度线

轴刻度线是轴线上的⼩线段，可以提供数值标签在坐标轴上的明确位置。轴刻度线有3种类型，分别为：置内、置中（即交叉⽅式）、置外。但刻度应置于数值坐标轴外侧，不建议刻度采⽤置中或置内⽅式显示。

轴刻度线的使⽤就是加强映射关系，快速的对应到数据点。分类轴较多出现在柱状、条形中，对于映射有天然的对应关系，故在分类轴中习惯隐藏轴上的刻度线。

2.3.3 ⽹格线

⽹格线是⽤来辅助图表优化映射关系的。使⽤⽹格线可以增加数据的可阅读性，⽹格线提供了两种功能：⼀是延伸数值刻度⾄可视化对象中，以便观察数据值之⼤⼩；⼆是增加可视化对象之间的⽐较基础，利于⽐较。

⽹格线⼀般跟随值域轴的位置单向显示，柱状图采⽤⽔平⽹格，条形图采⽤垂直⽹格。在使⽤⽹格线时，应该注意遵从主次原则，以轴线为主，⽹格线为辅，样式上可采⽤实线或者虚线。避免颜⾊过重，不要使⽤纯⿊或者纯⽩，在视觉层级上不能抢了图表中的信息。

2.3.4 轴标题

轴标题（单位）主要⽤于说明定义域轴、值域轴的数据含义。当可视化图表的其他部分内容（标题、图例、轴标签等）已经能充分表达数据含义，根据奥卡姆剃⼑定律，可以略去轴标题，近⼀步增⼤数据油墨⽐，精简画⾯元素。

2.3.5 轴标签

轴标签的设计较为复杂，涉及到的细节点⽐较多。这⾥将围绕直⻆坐标系的X轴和Y轴这两个⽅向进⾏讨论。

X轴标签

x 轴标签的设计重点在显示规则上，在可视化图表设计中，我们常常会碰到轴标签内容过⻓的情况，当空间有限时，轴标签会重叠在⼀起。如何处理此类问题，这⾥根据轴的不同类型给了对应的解决⽅案。

A. 连续/时间轴标签

在连续轴和时间轴中，我们可以利⽤抽样显示的⼿段来优化轴标签重叠的问题。这⾥不推荐使⽤旋转来缩减宽度。⼀⽅⾯从美观度上，旋转可能会破坏界⾯整体协调。另⼀⽅⾯，连续/时间轴并不需要显示所有的轴标签，参考格式塔中的[连续性原理]，尽管轴标签未能完全展示，但⽤户会在脑海中把缺失的部分补⻬，轴标签仍然会像连续着的⼀样。

B. 分类轴标签

在分类轴中，由于标签与标签之间并没有紧密的逻辑关联关系。若采⽤抽样规则，隐藏了⼀些标签，则加⼤了⽤户对图表信息的提取难度，这是我们不想看到的。对于分类轴，这⾥建议通过标签旋转或转换成其他图表（条形图）来缩减宽度。

Y轴标签

y 轴标签的设计重点在标签数量、取值范围和数据格式上。标签显示区域⼀般根据最⻓标签宽度⾃适应缩放。如果数组是固定的，就写成固定宽度，节省图表计算量，提⾼渲染速度。

A. 轴标签的数量

轴标签的数量不建议过多，太多的标签必定导致横向⽹格线变多，造成元素冗余，⼲扰图形信息表达。根据 7±2 法则，Y轴标签数量应尽量控制在这个范围内。

B. 轴标签的取值范围

⼀般来说，y 轴标签的取值应从 0 基线开始，以恰当反映数值。展示被截断的数据可能会误导⽤户做出错误的判断。⽐如数据本身没有那么起伏变化，处理上下限的颗粒度，把刻度拉⻓，⼀样能显得“⻓势喜⼈”。

从上⾯就能明⽩，在看图表的时候千万不要被表⾯给欺骗，仅仅观看柱状图的⾼低趋势往往不能得出正确结论，需要注意坐标轴起始位置有没有被⼈做过虚假处理。
但存在是有根源的，对于此类的取值⽅式不做过多评价。这⾥主要想讲⼀下我常⽤的取值⽅式：对于Y轴的上限即最⼤值根据实际数据进⾏动态计算。⽐如⼀排数字中最⼤的为1190，那么轴标签最⾼位为1200；⼀排数字中最⼤的是1210，那么轴标签最⾼位为1400。其中的1400和2100是根据轴上的分段数决定的。

但有些⼈对Y轴标签的取值给出了如下建议：在折线图中，取值⼀般保证图形约占绘图区域的2/3，或者将柱状的⾼度控制在图表⾼度的85%左右。

但我认为这种⽅式太刻意了，并且规则定制的⽐较细。但是得承认这样⼦确认会显的好看，做案例可以，做真实数据不⾏。因为考虑到实际数据有的时候会出现极限情况，⽐如有些特别⼤有些特别⼩，为了保证⽤户能从图表中准确地获取信息，不应该为了美感⽽破坏了它的真实性。因此并不推荐⽤这种⽅式来取值。

C. 轴标签的数据格式

关于Y轴标签的数据格式，这⾥重点讲⼀些⽐较容易忽视的设计细节。第⼀，标签保留的⼩数位数保持统⼀，不要因为某些轴标签是整数值，就略去⼩数点。

第⼆，正负向的 y 轴标签，由于负值带“-”符号，整个 y 轴看起来会有视觉偏差，特别是双轴图的右 y 轴更明显。这⾥建议正负向 y 轴给正值标签带上 “+”，以达到视觉平衡的效果。

3. 图例

3.1 定义

图例是对图形本身的概括，在图表元素中属于辅助内容。它提供读者以对照的⽅式来理解可视化对象的项⽬归类。由映射图形形状和⽂本组成。

3.2 类型

根据数据类型不同，分为连续型图例和分类型图例；根据状态不同，图例可以被设置为静态或可交互态。

3.3 使⽤建议

3.3.1 数字⽂本取整

正如，伦斯勒理⼯学院的⾏为经济学家⾼拉夫杰恩(Gaurav Jain)所说：“数字有⼀种语⾔的⼒量，能给予⼈⼀种特殊的感觉。当我们使⽤具体的整数数字时，⼈的衡量会减少。这种⾏为没有明显的原因。”

当⼈们的⼤脑在处理不以零结尾的不规则数字时，需要更多的脑⼒来处理，加⼤了获取信息的难度。因此在使⽤数字时，应该考虑这种偏好，倾向于⼀些取整的数字。同样的，这不仅仅适⽤于图例中的数字，同样适⽤于坐标轴上下限的数字。

3.3.2⽔平图例和垂直图例

带有连续性的倾向于使⽤⽔平图例，因为更符合⼈们的阅读习惯；带有分类属性的倾向于使⽤竖直图例，图例的右边可放置更⻓的⽂本。

3.3.3 图例的位置

默认把图例放在左上⻆去做⼀个通⽤的⽅案看起来没⽑病。但考虑到⼈的视觉动线是从上⾄下，从左到右。这⾥有⼀个更好的做法：缩短⽤户对照图例看图形的本能路径，可以提升对信息的获取效率。如下图所示：

3.3.4 多折线图采⽤跟随图例

当我们在制作多折线图时，经常会出现个数据系列之间相互交错的情形，并使得各种数据标记与之前的出现顺序不⼀致，即与图例排列顺序不同。因此⽤户的眼睛必须在图例与折线之间进⾏连连看，最佳的做法是采⽤跟随图例形式，去标识出折线所属于的维值信息，这样会更直观有效。

4. 标签

4.1 定义

在图表中，标签是对当前的⼀组数据进⾏的内容标注。包括数据点、拉线、⽂本数值等元素，根据不同的图表类型选择使⽤。

4.2 使⽤建议

4.2.1 标签的显示策略

在绘制的图表的时候，我们倾向将标签直接打在图形外，但在「堆叠类」图表中，标签会显示在图形内。这样做会有个后果，标签的⽂本和图形经常需要交叠展示，所以可读性需要⾜够良好，所以通过对 HS 值的判断，决定⽂字的颜⾊是否需要反思。这样对⽐度就在可控范围内，不会出现可读性的问题。有时，还需要增加描边，让标签更清晰。

当数据特别多并且密的时候会造成全部标签挤在⼀起的情况。在标签重叠时，采⽤动态计算的抽样显示⽅式，⾃动隐藏其中⼀个，同时当 Hover 图表时，显示被隐藏的对应的数据。这样保证了图表的清晰度，也保证了信息的完整性。

5. 提示信息

5.1 定义

提示信息⼀般是tap或者hover的时候，图表以交互的⽅式吐出该位置的数据，帮助⽤户更深⼊的了解数据。⼀般由视觉标记图形，⽂本标签，数值标记这3 中元素构成。

5.2 类型

提示信息的展现形式由4种。按不同的图表类型，分为悬浮、固定位置、固定在轴上、固定在图形上。

6. 图形

6.1 定义

⼈类从图形中获取信息的效率远⾼于⽂本，可以说如今⼈类早已进⼊了读图时代。图形是统计图表的视觉通道在形状上映射的视觉展现，是图表的必备元素，承载着数据背后蕴含的信息。按照组件原⼦化的思路来定义现在千奇百怪的图表，⼤致可以分为六种基础样式：折线，⾯积，散点，⽓泡，饼/环，柱形，条形。

6.2 使⽤建议

这⾥主要想重点讲⼀下，如何通过设计来强化图表信息的表达，以便简化⽤户获取信息的成本。关于具体某个图表的制作规范和运⽤场景，会在之后的⽂章中提及。

6.2.1 改变颜⾊ - 明暗/深浅/⾊彩对⽐

通过明暗对⽐、颜⾊对⽐以及⾊彩对⽐等⼿段可以有效的区分信息，在视觉层级上也是明显的处理了视觉噪⾳，便于⽤户区分信息。

6.2.2 添加标注

通过添加标注，⼈为去⼲预信息的表达，多⽤于⼀前⼀后的标识，便于⽤户识别信息。

三、选择合适的图表

我们做数据分析的有句话叫“⼀图胜千⾔”，图表是展现数据的⼀种重要展现形式，选对了图表就能帮助我们更加快速、直观的传达数据信息。
那如何挑选合适的图表呢？在我看来⼤致分为三步：
1. 确定核⼼内容：明确要⽤图表传达的核⼼信息；
2.判断⽐较关系：判断数据之间的⽐较类型（如占⽐、数量、趋势等）；
3.选择图表类型：选择对应含义的图表（如饼图、柱状图、折线图等）。

很多朋友在判定和选择图表类型时会不知所措，但其实你只需要记住⼀句话：决定图表形式的不是数据，⽽是你要传达的信息。

1. 确定核⼼内容

同⼀组数据⽤不同的⻆度看，有不同的主题，⽐如下⾯这组数据：

从另⼀个⻆度看同样是5⽉份的数据，你还可能会将侧重点放在每个产品占销售额的百分⽐上。那你的图表主题应该是“5⽉份，产品 A 占公司产品总销售额的⽐例位居⾸位”。
综上所述，选择合适图表的关键，最初也是最重要的，就是明确要⽤图表传达的核⼼信息。

2. 判断⽐较关系

在实际⼯作中需要⽤图表反映数据的场景五花⼋⻔，但按数据关系分类⽆⾮以下⼏种情况，给⼤家简单举⼏个例⼦：

“预计在今后 10 年多的时间⾥，销售额将增⻓ ”对应的关系为时间趋势；
“雇员的最⾼⼯资额在 30000 到 35000 美元之间 ”对应的关系为频率分布；
“汽油并不是牌⼦越响价格越⾼其性能就越好”对应的关系为相关性；
“9 ⽉份⾥，6 个区域的营业额⼤致相同”对应的关系为排名对⽐；
“销售部经理在他的领域内只花费了他 15% 的时间”对应的关系为占⽐。

3. 选择图表类型

国外专家Andrew Abela曾整理了⼀份图表类型选择指南图示（如下图），他把数据的关系分成了4种类型，帮助我们去选出合适的图表来呈现。

但其实结合我⾃⼰的经验，考虑到⽇常企业的数据分析场景，图中有些图表使⽤频率是⾮常低的。所以我参考了上图的部分内容，对其进⾏了总结，替换掉了⼀些图表并对其进⾏了美化，总体上我认为这是会更适合商务图表展示，⽽且会更接地⽓，适合⼤家参考使⽤。

四、常⻅的可视化图表

1. 折线图

1.1 定义

折线图是通过线条的波动（上升或下降）来显示连续数据随时间或有序类别变化的图表，常⽤于反映数据随着时间推移⽽产⽣的变化趋势。

2.2 适⽤场景

横轴为连续类别（如时间）且注重变化趋势、预测，适⽤于折线图。

举个例⼦：⽐如想看2020年上半年商品的营业额情况，并对⾛势做⼀个分析。由于每个⽉份的商品营业额相关的，它们代表⼀种数据在不同时间下的数据值，因此我们可以⽤折线图将它们连接起来。

但如果想看2020年上半年北京、上海、⼴州、深圳、南京五个省份的营业额情况，由于每个省份的营业额是不相关的，所以我们不能随便⽤折线图来替代柱状图。

2.3 使⽤建议

2.3.1 使⽤合适的时间间隔，使锯⻮状的线条平滑

如果折线图上下浮动过于剧烈，那么可以尝试拉⻓时间间隔，⽐如不每天采样⽽以周为单位来采样。⽤户不太愿意去阅读锯⻮状的线条，或者说他们不会喜欢这样的图表。

但是如果有强需求说是⼀定要在某个范围，这条略过。

2.3.2 善⽤数据点标记、特殊标记

当有些特定的数值特别重要时，我们可以在线条上标注出他们，但全部标清数据点在⼤多数情况下标记出来的意义不⼤，从视觉上来看会显得⾮常琐碎。

2.3.3 分清主次关系，加强数据感知

若对⽐数据较多，为了避免信息繁杂。可采⽤实线的强弱和⾊彩的对⽐来区分主次内容，让⽤户更关注在主折线，获取主数据的波动感知。

知识扩展：折线图与曲线图的区别

折线图：更关注于点的数据，相对短的⼀段时间数据随时间变化的趋势；
曲线图：更关注点构成的线点数据，⼀段时间内整体数据随时间变化的趋势。

曲线图是折线图中的一种，当图表数据点过于密集时，使用曲线图更能表达数据随时间变化的趋势、周期性。