国家开放大学数据可视化技术期末考试复习资料汇编.docx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《国家开放大学数据可视化技术期末考试复习资料汇编.docx》由会员分享,可在线阅读,更多相关《国家开放大学数据可视化技术期末考试复习资料汇编.docx(18页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、数据可视化技术课程复习知道超越高度温馨提醒:可以使用word查找功能快速查找对应题目和答案。查找快捷键:Ctrl+F一、考核说明数据可视化技术是国家开放大学数据科学与大数据技术专 业(本科)的一门核心课程。本课程的主要任务是讲授数据可视化的 方法和基本编程,注重强化培养学生的动手能力。本课程的主要目的 是培养学生的数据处理、可视化能力。通过本课程的教学,使学生掌 握数据的一般处理、可视化方法,并能使用至少一种数据可视化工具。 主要内容包括:介绍数据可视化的基础理论和概念、不同类型的数据 可视化方法,结合具体实例介绍Echarts可视化工具的使用,并以交 通、校园大数据为例介绍可视化综合应用系统
2、。本课程在注重基础知识的同时,特别强调学生实际动手能力的培 养,结合课程实训,使学生了解数据可视化基本概念、视觉感知和认 知的基本原理,掌握基本可视化方法;掌握数据预处理、特征提取等 及数据基本处理方法;掌握可视化系统的设计过程;掌握时空数据可 视化方法;掌握常用的可视化软件使用方法。1 .考核对象国家开放大学数据科学与大数据技术专业(本科)的学生。2 .考核方式与总成绩的记分方法本课程采用形成性考核与终结性考试相结合的考核方式评定学 生成绩。形成性考核成绩占课程总成绩的30%,终结性考试成绩占总 成绩的70%0学数据的科学可视化与处理抽象的、非结构化信息的信息可视化两个 分支。另一方面,由于
3、数据分析的重要性,将可视化与分析结合,形 成一个新的学科:可视分析学。科学可视化、信息可视化和可视分析 学三个学科方向通常被看成可视化的三个主要分支。3 . 可视化的基本原则真实性,指是否正确地反映了数据的本质,以及对所反映的事物 和规律有无正确的感受和认识。倾向性,也就是可视化所表达的意象对于社会和生活具有什么意 义和影响。可视化的艺术完美性,指其形式与内容是否和谐统一,是否有艺 术个性,是否有创新和发展。【理解】.可视化及数据可视化的意义可视化将不可见或难以直接显示的数据转化为可感知的图形、符 号、颜色、纹理等,以增强数据的识别效率,传递有效信息。使复杂 的、看似无法解释的相关数据建立联系
4、,从其中发现规则和特征,获 取更有价值的信息。(大概涵盖以上内容即可)。1 .视觉通道与可视化之间的联系数据可视化的核心内容是可视化编码,是将数据信息映射成可视 化元素的技术。可视化编码由两部分组成:几何标记(图形元素)和 视觉通道。几何标记:可视化中标记通常是一些几何图形元素,例如:点、 线、面、体。视觉通道:用于控制几何标记的展示特性,包括标记的位置、大 小、形状、方向、色调、饱和度、亮度等。【了解】.可视化的发展现状目前,数据可视化的发展主要有以下特点:呈现多维数据复合展 示的特征;涌现了大量的可视化工具;基于平台的可视化三维技术有 了进一步的应用发展;对于一些特殊行业的监控中心或者调度
5、中心等 重要指挥枢纽,大屏幕显示系统表现出超强的可视能力,已经成为现 代行业不可或缺的核心装备。主要通过借助于日益成熟和完备的图形-10 学理论以及数据挖掘等手段,通过更为有效的数据清洗,提取更为可 靠的特征属性结合相关领域背景的建模方法,最终使数据具备了可视 化解释,从而能够清晰有效地传达不为人知的内涵信息。当然,并不是所有数据都适合可视化,对那些多维而又凌乱的数 据集合进行前期梳理和有效属性整合,也是数据可视化技术发展的一 个应用方向。第2章数据处理可视化考核学生对数据的概念、处理过程、预处理、特征提取方法及数 据分析方法等内容的学习情况。【掌握】.数据的概念数据(data)是事实或观察的
6、结果,是对客观事物的逻辑归纳, 是用于表示客观事物的未经加工的原始素材。数据可以是连续的值, 比如声音、图像,称为模拟数据;也可以是离散的,如符号、文字, 称为数字数据。1 .数据的处理过程数据获取,数据预处理,数据特征提取,数据统计分析,数据存 储。2 .数据的预处理数据清醒,数据集成,数据变换,数据规约。3 .数据特征提取特征提取是通过映射的方法,将高维的属性空间压缩为低维的属 性空间,得到最小的属性集,使得数据类的概念分布尽可能地接近使 用所有属性的原分布,得到的数据挖掘结果与所有特征参加的数据挖 掘结果相近或完全一致。特征提取和特征选择统称为降维。【理解】1.数据分析方法数据分析是统计
7、分析的扩展,指用数据统计、数值计算、信息处 理等方法分析数据。用户可以根据自己的需求对数据进行分析处理, 比如数据挖掘、机器学习、数据统计等。大数据分析技术主要包括己 有数据的分布式统计分析技术和未知数据的分布式挖掘、深度学习技 术。【了解】.数据挖掘主要方法有哪些数据挖掘指设计特定算法,从大量的数据集中去探索发现知识或 者模式的理论和方法,是知识工程学科中知识发现的关键步骤。基本 的数据挖掘任务分为两类:基于某些变量预测其他变量的未来值,即 预测性方法(例如分类、回归);以人类可解释的模式描述数据(如 聚类、模式挖掘、关联规则发现)。第3章数据可视化设计考核学生对可视化设计的流程及基本原理等
8、内容的学习情况。【掌握】1 .可视化设计的流程早期的科学可视化流程描述了从数据空间到可视空间的映射,是 数据处理和图形绘制的组合,主要流程包含串行处理数据的各个阶 段:数据分析、数据滤波、数据的可视映射和绘制。2 . 格式塔理论包括哪些原则包括贴近原则、相似原则、连续原则、闭合原则、共势原则、好 图原则、对称性原则、经验原则。(1 )贴近原则:当视觉元素在空间距离上相距较近时,人们通 常倾向于将它们归为一组。(2)相似原则:人们在观察事物时,通常把那些明显具有共同 特性的事物组合在一起,虽然实际上事物本身并不存在分组的意图。(3)连续原则:人们在观察事物时会很自然地沿着物体的边界, 将不连续的
9、物体视为连续的整体,通过找到非常微小的共性将两个不 同的图形连接成一个整体。(4)闭合原则:在某些视觉映象中,其中的物体可能是不完整 的或者不是闭合的,但格式塔心理学认为,只要物体的形状足以表征 物体本身,人们就会很容易地感知整个物体,而忽视未闭合的特征。 -12-(5)共势原则:共势原则是指如果一组物体具有相同的运动趋 势或相似的排列模式,人眼就会将它们识别为同一类物体。(6)好图原则:好图原则是指人眼通常会自动将一组物体按照 简单、规则、有序的元素排列方式进行识别。(7)对称性原则:对称性原则是指人的意识倾向于将物体识别 为沿某个点或某条轴对称的形状。(8)经验原则:经验原则是指在某些情形
10、下视觉感知与过去的 经验有关。3 . 可视化中的美学因素聚焦:设计者必须通过适当的技术手段将用户的注意力集中到可 视化结果中的最重要区域。平衡:平衡原则要求可视化的设计空间必须被有效地利用,尽量 使重要元素置于可视化设计空间的中心或中心附近,同口寸确保元素在 可视化设计空间中的平衡分布。简单:简单原则要求设计者尽量避免在可视化中包含过多的造成 混乱的图形元素,也要尽量避免使用过于复杂的视觉效果(如带光照 的三维柱状图等)。【理解】可视化设计的基本原理人们通过视觉获取可视化信息、编码。为了便于人们形成认知, 数据可视化和语言都会遵循一定的传播规则,即语法。图形语法是数 据可视化所使用的语法,是一
11、种抽象级别较高的对图表的描述方法。 基本思路是把图表的主体看成是数据和几何图形的视觉特征绑定的 结果,并应用于不同的坐标系,通过这样的方式来组合成不同的图形 类别。图形语法通过图形元素、 图形属性和数据字段的映射三个要 素组成:图形元素(Geometry):可视化过程中使用的几何图形。图形属性(Attribute):视觉通道。映射(Mapping):数据字段到图形属性的映射,简单来说就是什 么类型的数据选择什么图形和视觉通道。【了解】.举例说明基本可视化方法适用的应用场景(1)例如:柱状图是最常见的图表,也最容易解读,它的适用 场合是二维数据集(每个数据点包括两个值X和y),但只有一个维 度需
12、要比较。(2)例如:直方图是一种统计报告图,是对数据集的某个数据 属性的频率统计。(3)例如:饼图主要用于展现不同类别数值相对于总数的占比 情况。饼图适合用来展示单一维度数据的占比,要求其数值中没有零 或负值,并确保各分块占比的总和为100%。(4)例如:折线图适合二维的大数据集,尤其是在趋势比单个 数据点更重要的场合,可以将排列在工作表的列或行中的数据绘制到 折线图中。(5)例如:散点图是表示二维数据的标准方法。散点图矩阵是 散点图的高维扩展,用来展现高维(大于二维)数据属性分布。可以 表达属性对之间的关系。第4章可视化软件与工具考核学生对Echarts等常用的数据可视化工具等内容的学习情
13、况。【掌握】.编程可视化类工具代表产品:EChart.js iCharts Dygraphs NodeBox D3.js 等 等。这一类数据可视化工具通常是某种编程语言或是需要基于某种编 程语言来实现,常用的有基于JavaScript、基于Java、基于Python以 及R语言等等。4 .常用的几种编程类可视化工具,写出各自的优缺点ECharts D3、R 语言。优缺点:ECharts优点是开源,使用简单,支持按需求打包,支 持地图功能,可支持绘制大量数据。缺点是体积较大,可定制性较差。 D3优点是可以图形化地、生动地展现数据、高度自由定制想要的效 果、开源,缺点是入门门槛高,对编程能力要求高
14、。R语言优点是支 持多种分析运算功能,缺点是需要一定的编程能力。-14-3.简要介绍一下异步加载数据的方法如当数据不断变化,需要实时加载时,无法提前存入显示的数据, 就需要异步加载填入数据。ECharts中实现异步数据的更新非常简单, 图表初始化后,在任何时候,只要通过jQuery等工具异步获取数据 后,通过setOption填入数据和配置项即可。【了角军】1.非编程类可视化工具ExcelTableau第5章时空数据可视化考核学生对时空数据基本概念、面对时空数据时可采用的可视化 方法、二维数据可视化方法、三维数据可视化方法及多维数据可视化 和关联分析可视化方法等内容的学习情况。【掌握】.面对时
15、空数据时可采用的可视化方法时变型数据的可视化设计空间涉及三个维度,即表达、比例尺和 布局。表达维度决定如何将时间信息映射到二维平面上,可选的映射 方式包括线性、径向、表格、螺旋形、随机等。比例尺维度决定以怎 样的比例将时序数据映射到可视化中,例如对数比例尺和线性比例 尺。布局维度决定以什么样的布局方式对时序数据进行排布。时变型数据的可视化方法可分为两类。一类方法采用静态方式展 示数据中记录的内容,不随时间变化,但可采用多视角、数据比较等 方法体现数据随时间变化的趋势和规律。另一类方法采用动画手法, 动态地展示随时间变化的感觉和过程,因而具有更多的表现空间。【理解】.二维数据可视化方法(1)折线
16、图、条形图、饼图(2)金字塔图、漏斗图(3)南丁格尔玫瑰图(4 )和弦图(5)矩阵树图(6 )桑基图(7)像素图(8)热力图(分别稍微展开介绍一下).三维数据可视化方法1 1 )时空立方体(2)雷达图(3)热力图(4)喷泉图(分别稍微展开介绍一下)【了解】2 .多维数据可视化常见的高维可视化方法有四种:(1)基于点的方法:以点为基础展现单个数据点与其他数据点 之间的关系(相似性、距离、聚类等信息)。(2)基于线的方法:采用轴坐标编码各个维度的数据属性值, 将体现各个数据属性间的关联。(3)基于区域的方法:将全部数据点的全部属性,以区域填充 的方式在二维平面布局,并采用颜色等视觉通道呈现数据属性
17、的具体 值。(4)基于样本的方法:采用图标或者基本的统计图表方法编码 单个高维数据点,并将所有数据点在空间中布局排列,方使用析。3 .关联分析可视化方法(1)网络关联图(2)稀疏散点图(3)嵌套饼图(4)泡沫图(5)词云(分别稍微展开介绍一下)-16第6章数据可视化综合应用举例考核学生对如何进行可视化系统的设计、完整数据可视化编程框 架、面向公交的可视化交叉检索系统、轨道交通异常客流可视化分析 系统及基于校园大数据的学生异常行为可视化分析系统等内容的学 习情况。【掌握】i.如何进行可视化系统的设计(1)完成需求分析(2)梳理主要工作(3)设计整体框架(4)视图分析,出具设计方案【理解】1.完整
18、数据可视化编程框架(1)如何、为何、用何可视化实现数据分析。(2)可视化流程:是以数据流向为主线,包括数据采集、数据 处理和变换、可视化映射和用户感知。(3)可视化交互:可视化过程中,用户控制修改数据采集、数 据处理和变换、可视化映射各模块而产生新的可视化结果,并反馈给 用户。(4)数据采集:传感器采样,调查记录,模拟计算等方式采集。 数据采集直接决定了数据的格式、维度、尺寸、分辨率和精确度等重 要性质,并在很大程度上决定了可视化结果的质量。(5)用户感知:从数据可视化结果中提取信息、知识和灵感。(6)可视化:从数据探索新的假设,证实相关假设与数据是否 吻合,帮助专家展示数据中的信息。(7)可
19、视分析:结合可视化和数据挖掘的分析模式,以视觉感 知为基本通道,通过可视化和交互界面,将人的知识或经验,融入到 数据分析和推理决策过程中,以迭代求精的方式将数据复杂度降低到 人类和计算机可以处理的范围,获取有效知识。【了解】.面向公交的可视化交叉检索系统1 .轨道交通异常客流可视化分析系统.基于校园大数据的学生异常行为可视化分析系统五、复习方法和建议.复习方法(1)重视基本理论知识的学习和掌握作为一种数据分析的工具,可视化已经成为各类数据分析的理论 框架和应用中的必备要素,并成为科学计算、商业智能、安全等领域 的普惠技术。数据可视化技术具有知识点多、实践性强的特点。本课 程从工程实用性出发,兼
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 国家 开放 大学 数据 可视化 技术 期末考试 复习资料 汇编
![提示](https://www.deliwenku.com/images/bang_tan.gif)
限制150内