第一章
1、什么是数据可视化
基于计算机的可视化系统,通过提供对数据的视觉表达来帮助 人们更有效地完成特定任务。
2、为什么要进行数据可视化
我们利用视觉获取的信息量,远远比别的感官要多得多;
数据可视化能够帮助我们对数据有更加全面的认识;
数据可视化能够在小空间中展示大规模数据。
3、数据可视化的目的
数据是根本,目的是导向。
数据可视化的目的,是对数据进 行可视化处理,以找到数据中蕴 含的模式、关系和异常。
模式,指数据中的规律。
关系,指数据之间的相关性(关联性和因果关系)。
➢ 数据间的比较 ➢ 数据的构成 ➢ 数据的分布或联系
异常,指有问题的数据。
➢ 设备出错 ➢ 人为错误输入 ➢ 正确的数据
4、数据可视化的作用
记录信息 分析推理 信息传播与协同
5、数据可视化分类
科学可视化、信息可视化、可是分析学
第二章
1、视觉感知和视觉认知
◼视觉感知是人类大脑的最主要功 能之一
◼人脑功能的50%用于对视觉感知 所得信息的处理
◼视觉感知是指客观事物通过人的视觉器官在人脑中形成的直 接反映,人类只有通过"视觉感知"才能达到"视觉认知"
◼感知:关于输入信号的本质;看见的东西
◼认知:关于怎样理解和解释看到的东西
2、视觉感知的处理过程
视觉寻找、寻找、分辨、识别、确定、记忆搜索
3、视觉编码
◼视觉编码(visual encoding)的定义一句话概括为:描述数据与可视化 结果的映射关系
◼把可视化结果看成一组图形符号的组合,这些图形符号中携带了被编 码的信息
◼当人们从这些符号中读取相应的信息时,就称之为解码
4、可视化编码
◼可视化编码由符号标记(图形元素)和视觉通道两部分组成
◼符号标记(图形元素):基本可视化图形元素,表示数据项和 连接,如点、线、面、体
◼视觉通道:是指符号标记的表现形式,表现数据的属性,包括 元素的颜色、位置、尺寸、形状、方向、色调、饱和度、亮度 、纹理等
5、视觉通道的类型
◼定性或分类的视觉通道:适合用于编码分类的数据信息,如形状、颜色的色 调、空间位置
◼定量或定序的视觉通道:适合用于编码有序的或者连续型的数据信息,如直 线的长度、区域面积、空间的体积、斜度、角度、颜色的饱和度和亮度等。
◼分组的视觉通道:分组是对多个或多种标记的组合来进行描述的。分组通道 包括接近性、相似性和包括性。分组通道适合将存在相互联系的分类的数据 进行分组,以此来表现数据内在的关联性
◼(灰度)值可被认为是有序 的,可用于编码数值型数据
◼色调通常认为是无序的,可 用于编码不同类别的值
6、视觉通道的表现力和有效性
◼精确性,人们视觉感知后的判断结果是否和原始数据相一致
◼可辨性,视觉通道有不同的取值范围,如何取值能使人们易于区分该视觉通 道的两种或多种取值状态
◼可分离性,不同视觉通道的编码对象放置到一起,是否容易分辨
◼视觉突出,对重要的信息,是否用更加突出的视觉通道进行编码
7、格式塔原则
接近原则、相似原则、闭合/连续原则、简单原则
8、色彩的三要素
◼ 色相(Hub):即色彩的相貌和特征, 指颜色的种类和名称
◼ 纯度(Saturation):又称饱和度,即 色彩的鲜艳程度,纯度越高,图像表现 得越鲜艳;纯度较低,图像则表现得比 较黯淡
◼ 明度(Brightness):指色彩的亮度。 颜色有深浅、明暗的变化
避免制造灾难为色彩设计上的第一准则------不要损害信息的呈现。
9、颜色主要通过三种方式用于数据可视化中
顺序配色、发散配色、分类配色
10、 数据采集与预处理
初始数据的获取、数据清理、数据集合与融合、数据变换、数据归约
11、文件存储
缺点:数据冗余、不一致;访问繁杂;安全性不高
优点:高度灵活;约束较少。
12、数据挖掘
作为数据内涵信息的展示方法和人机交互接口,数据可视化
已成为数据科学的核心要素之一
13、数据可视化流程
• 对象: 需要展示表达什么,数据抽象
• 目的:用户为何需要,任务抽象
• 手段:可视化构型,视觉编码与交互
流程:对象------->目的------->手段
◼ 通过人机交互将自动分析和可视方法紧密结合
◼ 流水线的起点是输入的数据,终点是提炼的知识
◼ 从数据到知识有两个途径:交互的可视化方法,自动的数据挖掘方法
◼ 两个途径的中间结果分别是对数据的交互可视化结果和从数据中提炼的数据模型
◼ 用户既可以对可视化结果进行交互的修正,也可以调节参数以修正模型
14、数据可视化基本原则
数据筛选、数据到可视化的直观映射、视图选择与交互设计、美学因素、可视化的隐喻、颜色与透明度
视图选择与交互设计:视图的交互包括视图的滚动与缩放、颜色映射的控制(提供调色盘让用户控制)、数据映射方式的控制(让用户可以用不同的数据映射方式来展示同一数据)、数据缩放工具
(用户可以选择最终可视化的数据内容)、细节控制(用户可以隐藏或突出数据的细节部分)等。
美学因素:平衡原则、简单原则、聚焦原则。
可视化的隐喻:用一种事物去理解和经历另一种事物的方法称为隐喻。隐喻的设计包含隐喻本体、隐喻喻体和可视化变量三个层面。。
颜色与透明度:颜色在数据可视化领域通常被用于编码数据的分类或定序属性。