数据可视化:解锁数据背后的视觉密码 第一章1、什么是数据可视化基于计算机的可视化系统通过提供对数据的视觉表达来帮助 人们更有效地完成特定任务。2、为什么要进行数据可视化我们利用视觉获取的信息量远远比别的感官要多得多数据可视化能够帮助我们对数据有更加全面的认识数据可视化能够在小空间中展示大规模数据。3、数据可视化的目的数据是根本目的是导向。数据可视化的目的是对数据进 行可视化处理以找到数据中蕴 含的模式、关系和异常。模式指数据中的规律。关系指数据之间的相关性关联性和因果关系。➢ 数据间的比较 ➢ 数据的构成 ➢ 数据的分布或联系异常指有问题的数据。➢ 设备出错 ➢ 人为错误输入 ➢ 正确的数据4、数据可视化的作用记录信息 分析推理 信息传播与协同5、数据可视化分类科学可视化、信息可视化、可是分析学第二章1、视觉感知和视觉认知◼视觉感知是人类大脑的最主要功 能之一◼人脑功能的50%用于对视觉感知 所得信息的处理◼视觉感知是指客观事物通过人的视觉器官在人脑中形成的直 接反映人类只有通过“视觉感知”才能达到“视觉认知”◼感知关于输入信号的本质看见的东西◼认知关于怎样理解和解释看到的东西2、视觉感知的处理过程视觉寻找、寻找、分辨、识别、确定、记忆搜索3、视觉编码◼视觉编码(visual encoding)的定义一句话概括为描述数据与可视化 结果的映射关系◼把可视化结果看成一组图形符号的组合这些图形符号中携带了被编 码的信息◼当人们从这些符号中读取相应的信息时就称之为解码4、可视化编码◼可视化编码由符号标记图形元素和视觉通道两部分组成◼符号标记图形元素基本可视化图形元素表示数据项和 连接如点、线、面、体◼视觉通道是指符号标记的表现形式表现数据的属性包括 元素的颜色、位置、尺寸、形状、方向、色调、饱和度、亮度 、纹理等5、视觉通道的类型◼定性或分类的视觉通道适合用于编码分类的数据信息如形状、颜色的色 调、空间位置◼定量或定序的视觉通道适合用于编码有序的或者连续型的数据信息如直 线的长度、区域面积、空间的体积、斜度、角度、颜色的饱和度和亮度等。◼分组的视觉通道分组是对多个或多种标记的组合来进行描述的。分组通道 包括接近性、相似性和包括性。分组通道适合将存在相互联系的分类的数据 进行分组以此来表现数据内在的关联性◼灰度值可被认为是有序 的可用于编码数值型数据◼色调通常认为是无序的可 用于编码不同类别的值6、视觉通道的表现力和有效性◼精确性人们视觉感知后的判断结果是否和原始数据相一致◼可辨性视觉通道有不同的取值范围如何取值能使人们易于区分该视觉通 道的两种或多种取值状态◼可分离性不同视觉通道的编码对象放置到一起是否容易分辨◼视觉突出对重要的信息是否用更加突出的视觉通道进行编码7、格式塔原则接近原则、相似原则、闭合/连续原则、简单原则8、色彩的三要素◼色相Hub即色彩的相貌和特征 指颜色的种类和名称◼纯度(Saturation)又称饱和度即 色彩的鲜艳程度纯度越高,图像表现 得越鲜艳纯度较低,图像则表现得比 较黯淡◼明度(Brightness)指色彩的亮度。 颜色有深浅、明暗的变化避免制造灾难为色彩设计上的第一准则——不要损害信息的呈现。9、颜色主要通过三种方式用于数据可视化中顺序配色、发散配色、分类配色10、 数据采集与预处理初始数据的获取、数据清理、数据集合与融合、数据变换、数据归约11、文件存储缺点数据冗余、不一致访问繁杂安全性不高优点高度灵活约束较少。12、数据挖掘作为数据内涵信息的展示方法和人机交互接口数据可视化已成为数据科学的核心要素之一13、数据可视化流程• 对象 需要展示表达什么数据抽象• 目的用户为何需要任务抽象• 手段可视化构型视觉编码与交互流程对象-------目的-------手段◼ 通过人机交互将自动分析和可视方法紧密结合◼ 流水线的起点是输入的数据终点是提炼的知识◼ 从数据到知识有两个途径交互的可视化方法自动的数据挖掘方法◼ 两个途径的中间结果分别是对数据的交互可视化结果和从数据中提炼的数据模型◼ 用户既可以对可视化结果进行交互的修正也可以调节参数以修正模型14、数据可视化基本原则数据筛选、数据到可视化的直观映射、视图选择与交互设计、美学因素、可视化的隐喻、颜色与透明度视图选择与交互设计视图的交互包括视图的滚动与缩放、颜色映射的控制提供调色盘让用户控制、数据映射方式的控制让用户可以用不同的数据映射方式来展示同一数据、数据缩放工具用户可以选择最终可视化的数据内容、细节控制用户可以隐藏或突出数据的细节部分等。美学因素平衡原则、简单原则、聚焦原则。可视化的隐喻用一种事物去理解和经历另一种事物的方法称为隐喻。隐喻的设计包含隐喻本体、隐喻喻体和可视化变量三个层面。。颜色与透明度颜色在数据可视化领域通常被用于编码数据的分类或定序属性。第三章1、时间属性的刻画1线性时间和周期时间线性映射方式径向和螺旋形映射方式顺序时间、分支时间和多角度时间按先后发生多股时间分支展开(平行世界)对同一事件的不同观点(不同目击者报告)2时间点和时间间隔离散时间点离散时间点之间的持续时间段