The Tesla Model 3 Survey

2019-11-01 20-19-35.2019-11-01 20_20_52.gif
The Tesla Model 3 Survey这是一个以交互式可视化方式呈现的,关于特斯拉 Model 3 的调查报告,分为四个主题,目前还在连载中
image.png
简短精炼的文字搭配交互式的可视化图表,不但可以提高用户的专注力,而且又能够帮助快速获取信息,赞👍。

image.png2019-11-01 20-32-39.2019-11-01 20_34_21.gif
by @司马淇(simaqi)

苍穹一粟:隐藏在搜索框之下的信息星图

屏幕快照 2019-11-01 下午8.41.18.png

随着我们能够获取的信息越来越多,在面对大型文档集的时候大部分都会选择依靠搜索来定位自己需要的信息。但搜索只能够显示直接结果,而丢失了搜索主题之外的周边信息 — 而这些信息恰恰对深入该主题是最为关键的。

屏幕快照 2019-11-01 下午8.42.18.png

Fathom工作室的作品《Laniakea》选取生物医学论文数据库Pubmed中热门的搜索关键词,并将其映射为宏大的宇宙图景,使用户能够快速浏览上百万个文档的聚类关系。每个文档被表现为星图中的一个粒子,采用t-sne算法进行布局。值得注意的是,这片交互式的星图支持层层下钻,在钻取的过程中页面的最上角会出现一个树形结构来提示当前的信息层级,并对当前层级的分布特征进行视觉上的简要抽象。
by @sakuya(liuye-szvim)

图解机器学习,房子属于旧金山还是纽约

用可视化的方式解释机器学习在分析“房子属于旧金山还是纽约”时的过程,详见链接
下面的所有图中,绿色横线/节点代表旧金山的房屋,蓝色代表纽约的房屋。

image.png

上图中横线的纵坐标代表了该房屋的所处位置的海拔高度,可以看出纽约没有房屋的海拔是高于 73m 的。因此如果有一个房屋数据其海拔为 73m 以上,则该房屋一定属于旧金山。73m 就是机器学习决策树中的一个分节点(fork),因为它可以作为决策树 if-else 的条件。
image.png
把第一张图变成直方图,横坐标越大代表海拔越高,柱子越高代表该海拔的房屋数量越多。可以看出不同海拔上房屋的数量。大多数纽约的房子坐落在海拔较低的地方。

后又借助此案例解释了机器学习中的 false negative、false positive 等概念。

介绍决策树的增长过程,越多层,预测结果越精确:
tree.gif

而机器学习仍然要承认其预测精确度有限的问题:
tree2.gif
by @十吾(shiwu-5wap2)

365天地球的平均颜色,不同的视角看蓝色星球

作者收集了基于modis卫星的Soumi VIIRS传感器的所有每日图像,并计算了2018年全年的每像素平均值,从不同的角度看蓝色星球。
image.png
by @ThinkGIS(xiaofengcanyue)

国际贸易数据可视化

这个网站可以看得到每个国家的国际贸易数据,包括进口、出口、贸易顺差/逆差、经济复杂性等。

下图是2017年中国(不包括香港、澳门和台湾)的出口情况。出口总额2.41万亿美元,是世界上出口最大的国家。出口最多的是广播电视设备、电脑、办公机械零部件、集成电路(芯片)和手机。你没看错,确实是有出口芯片,占总出口的3.3%.
image.png

下图是2017年中国(不包括香港、澳门和台湾)的进口情况。进口总额1.54万亿美元,进口最多的是芯片、原油、铁矿石、汽车和黄金。贸易顺差0.87万亿美元。
image.png

再看一下美国的情况。下图是2017年美国的出口情况。出口总额1.25万亿美元,出口最多的是精炼石油、汽车、飞机&直升机&航天器、汽轮机、包装药品。
image.png

下图是2017年美国的进口情况。进口总额2.16万亿美元,是世界上进口最大的国家。进口最多的是汽车、原油、广播电视设备、电脑、汽车零部件。贸易逆差0.91万亿美元。
image.png
by @长哲(changzhe)

食物的节奏

通过Google搜索人们关注的食物的关键字,可以揭示这些年来的主要食品趋势。并从这些数据中可以发现不同地区饮食兴衰的变化。
这个项目一个非常大的亮点通过定义了一种新的数据映射方式,于是同过新的图表可以非常方便的分析不同年份不同类型的食物在不同季节的搜索情况。这样就能比较好的分析食物的“节奏”。
这是一个完整的创新的可视化分析案例,对数据可视化有兴趣的同学都可以在这个case上受到不少启发。

image.png

image.png

image.png

食物时钟不同年份和和次数的映射关系
image.png
不同季节的呈现
image.png
by @镜曦(jingxi-g5ldr)

VAST 2019 解密—VA for Messages in Social Media

VAST challenge 竞赛,即可视化分析科技竞赛,是旨在提高领域可视化分析水平的年度竞赛,每年吸引全世界范围内的可视化专家、学者和从业人员参加。这篇文章详细介绍了雷尔可视化团队如何分析 Mini Challenge 3 数据

问题背景如下:St. Himark 有一个核电站,但是今年发生了地震。该市和应急响应小组希望了解市民所面临的问题,这些是无法通过地震读数和调查得到的。他们希望你能以社交媒体发帖为信息源,帮助他们确定工作重点和民众的关注点。
image.pngimage.png

雷尔团队首先尝试了解数据集,做简单的统计,从不同维度对消息进行聚合、统计,生成词云等,得到数据的最初印象。可以很直观的看出人们最关心的是震后核电站的破坏情况。

然后需要对这些关键词进行按主题分类,为此实现了一个 DBSCAN 聚类工具(左图),最终整理出了所有主题(右图)。
image.pngimage.png

最后设计了一个可视化分析工具,通过选择不同话题、时间和时间聚合值,可以将数据分别以地图轮播、时间趋势图和原始消息列表展示出来。
image.png

有了以上准备工作,就可以开始解决实际问题了,例如第一道题:资源分配问题。

选择相应的搜索条件,可以在地图上看到对应话题讨论状况,可以参考地图中各街区的消息分布数量,给出资源分配建议结果。为了更加简单直接,我们在增加一键生成表格功能,根据地图数据分布,自动生成一张话题讨论分布表,以“High”、“Medium”,“Low”三个等级展示状态。我们可以参考原始消息和这张表提出资源分配的建议。

image.png
最终这个作品也获得了 Honorable Mention 奖项。
by @沧东(cangdong)

【加餐】图布局 VS 人类是如何利用能源的?

引言 —— 你知道能源是如何流转的吗?人类是如何掌控能源的来源、中间环节、最终去向的?如何生成一张清晰表达能源流转的图?数以百计的图布局算法,究竟哪个适合展示能源流转?本文将分析各种布局,最终以最佳方式展现能源的流转。
AntV 团队专栏分享,作者 @十吾(shiwu-5wap2)