序言

打算开始写文章之前,《数据可视化》其实已经看到第四章了,有始有终,一切从头开始吧,文章不会照搬书本,会把个人觉得价值高的提取出来,尽量做到10分钟以内可以读完。
ps:文章统一放弃缩进,采用换行代替。

可视化释义

人眼是一个高带宽的巨量视觉信号输人开行处理器,文本快多个数量级,且大量的视最高带宽为每秒100MB具有觉信息的处理发生在潜意识阶段。其中的一个例子是视觉突变:在一大堆灰色物体中能瞬时注意到红色的物体。由于在整个视野中的视觉处理是并行的, 无论物体所占区间大小,这种突变都会发生。视觉是获取信息的最重要通道,超过50%的人脑功能用于视觉的感知,包括解码可视信息、高层次可视信息处理和思考可视符号。

可视化对应两个英文单词Visualize和Visualization, Visualize 是动词,意即“生成符合人类感知”的图像;通过可视元素传递信息。Visualization 是名词,表达“使某物、某事可见的动作或事实”;对某个原本不可见的事物在人的大脑中形成一幅可感知的心理图片的过程或能力。Visualization 也可用于表达对某目标进行可视化的结果,即帧图像成动面在计算机学科的分类中,利用人眼的感知能力对数据进行交互的可视表达以增强认知的技术,称为可视化。它将不可见或难以直接显示的数据转化为可感知的图形,符号,颜色纹理等,增强数据识别效率,传递有效信息。

可视化的终极目的是对事物规律的洞悉,而非所绘制的可视化结果本身,可视化的作用体现在多个方面,如揭示想法和关系、形成论点或意见、观察事物演化规律、总结或聚积数据、存档和汇整、寻求真相和真理、传播知识个探索性数据分析等。

从宏观角度看,可视化包括三个功能:信息记录、支持对信息对推理和分析、信息传播与协同。

信息记录:
将浩瀚烟云的信息记录成文、时代传播的有效方式之一是将信息成像或采用草图记载。
3483448182.jpg timg.jpeg
图1.1 左:1616年伽利略关于月亮周期的绘图; 右:达芬奇绘制的人头盖骨可视化。

支持对信息对推理和分析:
1831年起,欧洲大陆暴发霍乱,当时的主流理论是毒气或瘴气引起了霍乱。英国医生John Snow着手研究1854年8月底伦敦布拉德街附近居民区爆发的一场霍乱。Snow调查病例发生的地点和取水的关系,发现73个病例离布拉德街水井的距离比附近其他任何一个水井的距离都更近。在拆除布拉德街水井的摇把后不久,霍乱停息。Snow 绘制了一张 布拉德街区的地图(见图1.2),标记了水井的位置,每个地址(房子)里的病例用图符显示。图符清晰地显示了病例集中在布拉德街水井附近,这就是著名的鬼图。
snow.gif
图1.2 “鬼图”帮助发现霍乱流行的原因(X表示水井)

信息传播与协同:
在移动互联网时代,资源互联和共享、群体协同与合作成为科学和社会发展的新动力。美国华盛顿大学的可视化专家Zonn Popovi 教授与蛋白质结构学家开发了一款Fald.It的多用产在线网络游戏(见图1.3)。 Foid.It让玩家从半折叠的蛋白质结构起步,根据简单的规则扭曲蛋白质使之成为理想的形状。实验结果表明,玩家预测出正确的蛋白质结构的速度比任何算法都快(有些情况采用计算机暴力求解需要几百年),而且能凭直觉解决计算机没办法解决的问题。这个实例表明,在处理某些复杂的科学问题上,人类的直觉胜于机器智能,也证明可视化、人机交互技术等在协同式知识传播与科学发现中的重要作用。
wholeprotein.png
图1.3 Fald.It在线游戏可视化界面

可视化简史

可视化发展史与测量、绘画、人类现代文明的启蒙和科技的发展一脉相承,在地图、科学与工程绘图、统计图表中,可视化理念与技术已经发展了数百年。

16世纪初,人类已经掌握了精确的观测技术和设备,也采用手工方式绘制可视化作品。

进入18世纪,绘图师不再满足于在地图上展现几何信息,发明了新的图形化形式(等值线、轮廓线)和其他物理信息的概念图(地理、经济、医学), 18世纪是统计图形学的繁盛时期,其奠基人William Playfair发明了折线图、柱状图、显示局部与整体关系的饼图和圆图等今天最常用的统计图表。
0069Nx3Nzy6USxl47rJ63.png
图1.4 丹麦和挪威1700-1780年间的进出口序列图

20世纪上半叶对于可视化而言上一个缺乏创新的时期,但是可视化随着统计图形的主流化开始面向政府、商业和科学走向应用普及,人们第一次意识到图形显示的方式能为航空、物理、天文和生物学科与工程 领域提供新的洞察和发现机会,多维数据可视化和心里学的介入成为这个时期的重要特点。
beck_map.jpg
图1.5 1933年Henry Beck设计的伦敦地铁图成为地铁路线的标准可视化方法,沿用至今。

进入21世纪,现有的可视化技术已难以应对海量、高维、多源和动态数据的分析挑战,需要综合可视化、图形学、数据挖掘理论与方法,研究新的理论模型、新的可视化方法和新的用户交互手段,辅助用户从大尺度、复杂、矛盾甚至不完整的数据中快速挖掘有用的信息,以便做出有效决策。