背景

数据源

主标题 Hey ladies
副标题 United States, “men who sexually

harassed women
20 years ago should keep their jobs today | | | | 说明 | % of adults agreeing, by age | | 来源 | Source: YouGov | | 附注 | 1,500 Americans surveyed |

sex age group candidate perf time percentage
Female Over 65 Clinton Nov 2017 25
Female Over 65 Clinton Sep 2018 11
Female Over 65 Trump Nov 2017 32
Female Over 65 Trump Sep 2018 80
Female 30-64 Clinton Nov 2017 18
Female 30-64 Clinton Sep 2018 14
Female 30-64 Trump Nov 2017 38
Female 30-64 Trump Sep 2018 53
Female Under 30 Clinton Nov 2017 15
Female Under 30 Clinton Sep 2018 15
Female Under 30 Trump Nov 2017 52
Female Under 30 Trump Sep 2018 48
Male Over 65 Clinton Nov 2017 16
Male Over 65 Clinton Sep 2018 20
Male Over 65 Trump Nov 2017 58
Male Over 65 Trump Sep 2018 65
Male 30-64 Clinton Nov 2017 17
Male 30-64 Clinton Sep 2018 22
Male 30-64 Trump Nov 2017 45
Male 30-64 Trump Sep 2018 65
Male Under 30 Clinton Nov 2017 25
Male Under 30 Clinton Sep 2018 13
Male Under 30 Trump Nov 2017 40
Male Under 30 Trump Sep 2018 44

The Economist January 12th 2019 - Sister sledging.pdf
Excel中一维表不能直接作为作图的数据源,因此整理了数据源:
female

age group Clinton Nov 2017 Clinton Sep 2018 Trump Nov 2017 Trump Sep 2018 Lot0 Lot1 Lot2 Lot3 Lot4 Lot5 Level
Over 65 25 11 32 80 -20 11 14 7 48 0 0.5
30-64 18 14 38 53 -20 14 4 20 15 27 1.5
Under 30 15 15 52 48 -20 15 0 33 4 28 2.5

male

age group Clinton Nov 2017 Clinton Sep 2018 Trump Nov 2017 Trump Sep 2018 Lot0 Lot1 Lot2 Lot3 Lot4 Lot5 Level
Over 65 16 20 58 65 -20 16 4 38 7 15 0.5
30-64 17 22 45 65 -20 17 5 23 20 15 1.5
Under 30 25 13 40 44 -20 13 12 15 4 36 2.5

效果

007 多维度数据图表.png

左图横轴表示 数据维度 ,纵轴表示 年龄维度 ,数据系列表示 阵营维度 ,用切片器控制剩下的两个维度: 性别时间 ,但是不能将五个维度同时展现在一张图上,破坏了数据的相互关系:男女对比、变化趋势。

右图实际上由两张图拼成,上下拼接对比 性别维度 上的表现,横轴表示 数据维度 ,纵轴表示 年龄维度 ,数据系列表示 阵营维度,带方向的箭头标记自带 时间维度
类似于杠铃图的制作方式,堆积条形图 + 散点图。细节元素有:

  1. image.pngimage.pngimage.pngimage.pngimage.pngimage.pngimage.png
  2. image.png
  3. image.png

优化清单

整体采用系列套图的形式(简单的性别维度拓展)
单张图采用堆积图(做法参考图表大全004杠铃图的制作)
堆积条形图做底,散点图做数据点,设置左对齐标签,特殊样式
为了拓展维度使用了两种系列颜色、两种自定义图标
两种自定义数据图标配合突出时间线变化
系列模拟的网格线和真实网格线样式匹配

制作步骤

  1. 选中数据源,插入堆积条形图
  2. 切换行列
  3. 选中数据系列,右键更改图表类型,将Clinton和Trump相关系列更改为散点图
  4. 选中数据系列,图表设计-选择数据,编辑Clinton和Trump相关系列的X轴系列值和Y轴系列值
    image.png
  5. 删除不需要的元素
  6. 设置图表区和绘图区为“无填充”
  7. 插入图形制作背景图,填充为蓝灰色,设置为“无轮廓”,将其置于底层
  8. 选中lot3数据系列,设置间隙宽度为500%
  9. 设置绘图区外边框为“无线条”
    image.png
  10. 复制灰色条形元素到lot1、lot3、lot5上
  11. 复制矩形和三角元素到Clinton和Trump相关系列上
  12. 单独选中反方向的数据,单独黏贴反方向的三角元素;单独选中与矩形重叠的三角元素,设置标记选项为“无”
  13. 设置lot2的颜色为蓝色、lot4的颜色为红色
    image.png
  14. 选中纵坐标轴,设置标签位置为“无”,线条为“实线”,黑色,1.5磅
  15. 选中最左边的数据系列,添加数据标签,位置为“轴内侧”
    若看不到最左边的数据系列,可能是因为超出横轴数据范围,重新设置范围覆盖数据,即可重新出现
  16. 选中新添加的数据标签,标签选项去掉勾选“值”,然后勾选“单元格中的值”,选择标签名
  17. 选中最左边的数据系列,设置为“无填充”
  18. 选中横坐标轴,设置范围为0到80,并调整绘图区大小
    image.png
  19. 选中纵坐标轴,勾选逆序类别
  20. 添加次要纵坐标轴,勾选逆序刻度值,并删除该轴
    image.png
  21. 选中竖向的网格线,设置宽度为1.5磅
    image.png

    分析

    | 图表类型 | 简单组合图+堆积条形图 | | —- | —- | | 适用数据 | 统计维度特别多的情况 | | 突出特征 | 利用组合图、颜色、标记类型来存储和表示多维度信息 |
  1. 本案例最大特征就是包含了大量的维度。在以“一维表”的模式存储时可以看到一共是五个维度。但是通常情况下一张图表的标准能够处理的维度其实是三个,横轴、纵轴和系列。一旦超出该部分内容就难以用一张普通图表去进行完成,但是本案例提供了两个的思路:

    1. 通用解法,遇到再多的维度也可以用相似的方法进行拓展,就是数据透视图的筛选器。将数据整理为一维表后建立数据透视表和透视图。该方法的成本是信息存放于多个独立平面,每次切换需要进行操作,无法做到尽收眼底的效果。
    2. 采用组合图来进行维度的拓展,将不同维度的独立数据平面进行平铺,做到尽收眼底的效果,但是不宜过多,形成一个多维矩阵即可。第二个思路就是利用特殊的系列自定义图形标记,将系列不仅仅是做单层次的分类,还细化成更多维度的表述。比方说,颜色区分一个维度、数据标记形状区分其他维度(数据标记可以自定义非常多种,因此可以区分非常多的维度)。
  2. 多维度数据图表的制作涉及数据组织问题。
    多维度的数据无论如何都可以整理成最为原始的一维表形式,存在多少个字段就代表其最终的维度数。但是却不可以将多维度的一维表直接用于图表的制作,主要是因为数据图表本身就是二维的表示方式,因此能够正常接收的数据也就是二维表的形式,因此条形图就必须准备好分类作为一个轴,准备好数值作为另一个轴,其他的维度都要被压缩为一个轴,具体横轴纵轴各容纳多少个维度就根据实际情况执行,案例使用数据是一共五个维度,组合图吃掉一个维度、纵轴吃掉一个维度、横轴吃掉三个维度,这点对于其他类型的图表也都是类似的。

  3. 本案例将支持者以5个维度分为12组。结论:

    1. 特朗普阵营就这一问题,各年龄段分歧较大。
    2. 克林顿阵营从保守变得更保守,特朗普阵营从激进变得更激进,两极分化明显。
    3. 克林顿阵营和特朗普阵营的支持者,就这一问题泾渭分明。