大数据导论第7章-数据可视化课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《大数据导论第7章-数据可视化课件.pptx》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 导论 可视化 课件
- 资源描述:
-
1、数据中国“百校工程”项目系列教材数据科学与大数据技术专业系列规划教材第7章 数据可视化 本章主要内容如下。本章主要内容如下。(1 1)可视化的含义。)可视化的含义。(2 2)可视化的发展历程。)可视化的发展历程。(3 3)可视化的作用。)可视化的作用。(4 4)数据可视化分类。)数据可视化分类。(5 5)数据可视化工具。)数据可视化工具。7.1 什么是可视化7.1.1 7.1.1 可视化的含义可视化的含义 测量的自动化、网络传输过程的数字化和大量的计算机仿真产测量的自动化、网络传输过程的数字化和大量的计算机仿真产生了海量数据,超出了人类大脑分析处理的能力。生了海量数据,超出了人类大脑分析处理的
2、能力。可视化(可视化(VisualizationVisualization)提供了解决这种问题的一种新方法。)提供了解决这种问题的一种新方法。一般意义下的可视化的定义:可视化是一种使复杂信息能够容易和一般意义下的可视化的定义:可视化是一种使复杂信息能够容易和快速被人理解的手段,是一种聚焦在信息重要特征的信息压缩,是快速被人理解的手段,是一种聚焦在信息重要特征的信息压缩,是可以放大人类感知的图形化表示方法。可以放大人类感知的图形化表示方法。可视化就是把数据、信息和知识转化为可视的表示形式并获可视化就是把数据、信息和知识转化为可视的表示形式并获得对数据更深层次认识的过程。可视化作为一种可以放大人类
3、感得对数据更深层次认识的过程。可视化作为一种可以放大人类感知的数据、信息、知识的表示方法,日益受到重视并得到越来越知的数据、信息、知识的表示方法,日益受到重视并得到越来越广泛的应用。可视化可以应用到简单问题,也可以应用到复杂系广泛的应用。可视化可以应用到简单问题,也可以应用到复杂系统状态表示问题。人们可以从可视化的表示中发现新的线索、新统状态表示问题。人们可以从可视化的表示中发现新的线索、新的关联、新的结构、新的知识,促进人机系统的结合,促进科学的关联、新的结构、新的知识,促进人机系统的结合,促进科学决策。决策。可视化充分利用计算机图形学、图像处理、用户界面、人机可视化充分利用计算机图形学、图
4、像处理、用户界面、人机交互等技术,形象、直观地显示科学计算的中间结果和最终结果交互等技术,形象、直观地显示科学计算的中间结果和最终结果并进行交互处理。可视化技术以人们惯于接受的表格、图形、图并进行交互处理。可视化技术以人们惯于接受的表格、图形、图像等方法并辅以信息处理技术将客观事物及其内在的联系进行表像等方法并辅以信息处理技术将客观事物及其内在的联系进行表现,可视化结果便于人们记忆和理解。现,可视化结果便于人们记忆和理解。可视化为人类大脑与计算机这两个信息处理系统之间提供了可视化为人类大脑与计算机这两个信息处理系统之间提供了一个接口。可视化对信息的处理和表达方式有其他方式无法取代一个接口。可视
5、化对信息的处理和表达方式有其他方式无法取代的优势,其特点可总结为可视性、交互性和多维性。的优势,其特点可总结为可视性、交互性和多维性。7.1.2 7.1.2 可视化的发展历程可视化的发展历程 可视化技术使人能在三维图形世界中直接对具有形体的信息可视化技术使人能在三维图形世界中直接对具有形体的信息进行操作,和计算机直接交流。这种技术已经把人和机器的力量进行操作,和计算机直接交流。这种技术已经把人和机器的力量以一种直觉而自然的方式加以联系,这种革命性的变化无疑将极以一种直觉而自然的方式加以联系,这种革命性的变化无疑将极大地提高人们的工作效率。可视化技术赋予人们一种仿真的、三大地提高人们的工作效率。
6、可视化技术赋予人们一种仿真的、三维的并且具有实时交互的能力,这样人们可以在三维图形世界中维的并且具有实时交互的能力,这样人们可以在三维图形世界中用以前不可想象的手段来获取信息或发挥自己创造性的思维。用以前不可想象的手段来获取信息或发挥自己创造性的思维。人们对计算机可视化技术的研究已经历了一个很长的历程,人们对计算机可视化技术的研究已经历了一个很长的历程,而且形成了许多可视化工具,其中而且形成了许多可视化工具,其中SGISGI公司推出的公司推出的GLGL三维图形库表三维图形库表现突出,其易于使用而且功能强大。利用现突出,其易于使用而且功能强大。利用GLGL开发出来的三维应用开发出来的三维应用软件
7、颇受许多专业技术人员的喜爱,这些三维应用软件已涉及建软件颇受许多专业技术人员的喜爱,这些三维应用软件已涉及建筑、产品设计、医学、地球科学、流体力学等领域。筑、产品设计、医学、地球科学、流体力学等领域。随着计算机技术的发展,随着计算机技术的发展,GLGL已经进一步发展成为已经进一步发展成为OpenGLOpenGL。OpenGLOpenGL已被认为是高性能图形和交互式视觉处理的标准,在计算已被认为是高性能图形和交互式视觉处理的标准,在计算机领域被广泛采用。机领域被广泛采用。7.1.3 7.1.3 可视化的作用可视化的作用1 1可视化后的信息易于理解可视化后的信息易于理解2 2以建设性方式讨论结果以
8、建设性方式讨论结果3 3理解运营和结果之间的连接理解运营和结果之间的连接4 4发现新兴趋势发现新兴趋势5 5与数据交互与数据交互7.2 数据可视化及其分类 数据可视化是可视化技术针对大型关系型数据库或数据仓库数据可视化是可视化技术针对大型关系型数据库或数据仓库的应用,它旨在用图形和图像的方式展示大型数据库中的多维数的应用,它旨在用图形和图像的方式展示大型数据库中的多维数据,并且以可视化的形式反映对多维数据的分析及内涵信息的挖据,并且以可视化的形式反映对多维数据的分析及内涵信息的挖掘。数据可视化技术凭借计算机的巨大处理能力、计算机图像和掘。数据可视化技术凭借计算机的巨大处理能力、计算机图像和图形
9、学基本算法,以及可视化算法,把海量的数据转化为静态或图形学基本算法,以及可视化算法,把海量的数据转化为静态或动态图并呈现在人们的面前,并允许通过交互手段控制数据的抽动态图并呈现在人们的面前,并允许通过交互手段控制数据的抽取和画面的显示,使隐含于数据之中不可见的现象变得可见,为取和画面的显示,使隐含于数据之中不可见的现象变得可见,为人们分析、理解数据、形成概念、找出规律提供了强有力的手段。人们分析、理解数据、形成概念、找出规律提供了强有力的手段。数据可视化技术诞生于数据可视化技术诞生于2020世纪世纪8080年代,是运用计算机图形学和年代,是运用计算机图形学和图像处理等技术,以图表、地图、动画或
10、其他使内容更容易理解的图像处理等技术,以图表、地图、动画或其他使内容更容易理解的图形方式来表示数据,使数据所表达的内容更容易被处理。数据可图形方式来表示数据,使数据所表达的内容更容易被处理。数据可视化技术与虚拟现实技术、数据挖掘、人工智能,甚至与人类基因视化技术与虚拟现实技术、数据挖掘、人工智能,甚至与人类基因组计划等前沿学科领域都有着密切的联系。组计划等前沿学科领域都有着密切的联系。从纯技术角度来看,数据可视化大体可以分为从纯技术角度来看,数据可视化大体可以分为5 5类:基于几何类:基于几何投影的数据可视化、面向像素的数据可视化、基于图标的数据可视投影的数据可视化、面向像素的数据可视化、基于
11、图标的数据可视化、基于层次的数据可视化及基于图形的数据可视化。化、基于层次的数据可视化及基于图形的数据可视化。从实用角度来看,数据可视化大体可以分为从实用角度来看,数据可视化大体可以分为3 3类:科学可视化、类:科学可视化、信息可视化和可视化分析学。信息可视化和可视化分析学。7.2.1 7.2.1 科学可视化科学可视化 1987 1987年,在华盛顿召开的一次科学计算会议上,针对大数据处年,在华盛顿召开的一次科学计算会议上,针对大数据处理问题,美国计算机成像专业委员会提出了解决方案:可视化理问题,美国计算机成像专业委员会提出了解决方案:可视化用图形和图像解释数据。这次会议形成了题为用图形和图像
12、解释数据。这次会议形成了题为“科学计算可视化科学计算可视化”的报告,后被称为科学可视化(的报告,后被称为科学可视化(Scientific VisualizationScientific Visualization,SVSV)。)。1 1可视化是一种计算方法可视化是一种计算方法 可视化用图形来描述物理现象,把数学符号转化成几何图形,可视化用图形来描述物理现象,把数学符号转化成几何图形,以直观、形象的方式来表达数据,显示数据中所包含的信息,使以直观、形象的方式来表达数据,显示数据中所包含的信息,使科学家和工程技术人员能有效地观察、模拟和计算,并进行交互科学家和工程技术人员能有效地观察、模拟和计算,
13、并进行交互控制。科学可视化包括图像生成和图像理解两个部分,它既是由控制。科学可视化包括图像生成和图像理解两个部分,它既是由复杂多维数据集产生图像的工具,又是解释输入计算机的图像数复杂多维数据集产生图像的工具,又是解释输入计算机的图像数据的手段。它得到以下几个相对独立的学科的支持:计算机图形据的手段。它得到以下几个相对独立的学科的支持:计算机图形学、图像处理、计算机视觉、计算机辅助设计、信号处理、图形学、图像处理、计算机视觉、计算机辅助设计、信号处理、图形用户界面及交互技术。用户界面及交互技术。2 2可视化所研究的课题就是人与计算机之间的交互机制可视化所研究的课题就是人与计算机之间的交互机制 可
14、视化应使人与计算机协同地感知、利用和传递视觉信息。可视化应使人与计算机协同地感知、利用和传递视觉信息。科学可视化按功能划分为如下科学可视化按功能划分为如下3 3种形式。种形式。(1 1)事后处理方式。计算和可视化是分成两个阶段进行的,两者)事后处理方式。计算和可视化是分成两个阶段进行的,两者之间不进行交互作用。之间不进行交互作用。(2 2)追踪方式。可将计算结果即时以图像显示,以使研究人员了)追踪方式。可将计算结果即时以图像显示,以使研究人员了解当前的计算情况,决定计算是否继续。解当前的计算情况,决定计算是否继续。(3 3)驾驭方式。这是科学可视化的最高形式。研究人员可参与计)驾驭方式。这是科
15、学可视化的最高形式。研究人员可参与计算过程,对计算进行实时干预。算过程,对计算进行实时干预。3 3科学可视化的应用范围包括当代科学技术的各个领域科学可视化的应用范围包括当代科学技术的各个领域 其中,典型的领域如下。其中,典型的领域如下。(1 1)科学研究:分子模型、医学图像、数学、地球科学、空间探)科学研究:分子模型、医学图像、数学、地球科学、空间探索及天体物索及天体物 理学。理学。(2 2)工程计算:计算流体力学和有限元分析。)工程计算:计算流体力学和有限元分析。4 4当前科学计算可视化技术的发展特点当前科学计算可视化技术的发展特点(1 1)可视化图像的实时显示及交互控制)可视化图像的实时显
16、示及交互控制(2 2)网络环境下实现的科学计算可视化)网络环境下实现的科学计算可视化(3 3)虚拟环境下实现的科学计算可视化)虚拟环境下实现的科学计算可视化7.2.2 7.2.2 信息可视化信息可视化 信息可视化(信息可视化(Information VisualizationInformation Visualization,InfoVisInfoVis)是情)是情报学领域一个较新的研究热点。国外信息管理与信息系统专业、报学领域一个较新的研究热点。国外信息管理与信息系统专业、图书情报学专业对这一领域的研究非常活跃,一些大学的信息管图书情报学专业对这一领域的研究非常活跃,一些大学的信息管理类专业
17、开设了这方面的课程。对信息可视化技术进行分类,可理类专业开设了这方面的课程。对信息可视化技术进行分类,可以对其方法和应用目的更加明确,从而帮助用户针对问题和应用以对其方法和应用目的更加明确,从而帮助用户针对问题和应用领域选择合适的可视化技术;同时,可以发现现有可视化研究的领域选择合适的可视化技术;同时,可以发现现有可视化研究的不足,从而促使研究人员开发更新的可视化技术。不足,从而促使研究人员开发更新的可视化技术。在可视化领域,一般将信息数据分为如下在可视化领域,一般将信息数据分为如下6 6类。类。1 1一维数据一维数据 这类数据以一维向量为主,只具有单一属性,主要用来表征这类数据以一维向量为主
18、,只具有单一属性,主要用来表征数值、时间、方向等具有射线属性的一维坐标信息。数值、时间、方向等具有射线属性的一维坐标信息。2 2尺寸数据尺寸数据 这类数据主要出现在平面设计、地理图件和地理信息系统相这类数据主要出现在平面设计、地理图件和地理信息系统相关的应用领域,一般采用横纵坐标法呈现其数据,可以充分将横关的应用领域,一般采用横纵坐标法呈现其数据,可以充分将横向和纵向的位置信息显现出来,并且可以利用相应的位置坐标数向和纵向的位置信息显现出来,并且可以利用相应的位置坐标数据做空间信息计算,如求最短路程、最小面积和最小高程等。据做空间信息计算,如求最短路程、最小面积和最小高程等。3 3三维数据三维
19、数据 三维数据包含三维数据包含3 3个维度的属性信息,能够更加立体和直观地展个维度的属性信息,能够更加立体和直观地展示事物的立体属性和物理状态。该数据类型的应用领域比较广泛,示事物的立体属性和物理状态。该数据类型的应用领域比较广泛,我们熟知的医学、地质、气象、工业工程设计等领域都离不开三我们熟知的医学、地质、气象、工业工程设计等领域都离不开三维数据类型的支撑。维数据类型的支撑。4 4多维数据多维数据 这类数据包含这类数据包含4 4个或个或4 4个以上的属性信息,主要用于分析多维个以上的属性信息,主要用于分析多维数据内部属性的关联和相互关系。该类数据以财务与统计数据为数据内部属性的关联和相互关系
20、。该类数据以财务与统计数据为主,主要用于分析过往的财务状况,预测未来的可能的发展趋势主,主要用于分析过往的财务状况,预测未来的可能的发展趋势等。这是信息可视化研究的一个重要方向。等。这是信息可视化研究的一个重要方向。5 5分层数据分层数据 分层数据模型是一种抽象的分类数据集合模式,是比较常见分层数据模型是一种抽象的分类数据集合模式,是比较常见的数据关系。传统的图书馆资源管理模型和窗口系统资源管理模的数据关系。传统的图书馆资源管理模型和窗口系统资源管理模型使用的就是典型的分层数据,这类模型将现实的事务管理做分型使用的就是典型的分层数据,这类模型将现实的事务管理做分层、分类处理,以达到科学、高效管
21、理的目的。层、分类处理,以达到科学、高效管理的目的。6 6文本数据文本数据 这类数据形式多样,如报纸、邮件、新闻等信息都可以作为这类数据形式多样,如报纸、邮件、新闻等信息都可以作为文本数据。有大量多媒体和超文本信息的互联网成为文本数据的文本数据。有大量多媒体和超文本信息的互联网成为文本数据的较大来源之一。较大来源之一。7.2.3 7.2.3 可视化分析学可视化分析学 可视化分析学是通过交互式可视化界面促进分析推理的一门可视化分析学是通过交互式可视化界面促进分析推理的一门科学。可视化分析学尤其关注的是意会和推理,科学可视化处理科学。可视化分析学尤其关注的是意会和推理,科学可视化处理的是那些具有天
22、然几何结构的数据,信息可视化处理的是抽象数的是那些具有天然几何结构的数据,信息可视化处理的是抽象数据结构,如树状结构或图形。据结构,如树状结构或图形。人们可以利用可视化分析工具从海量、多维、多源、动态、人们可以利用可视化分析工具从海量、多维、多源、动态、时滞、异构、含糊不清甚至矛盾的数据中综合出信息并获得深刻时滞、异构、含糊不清甚至矛盾的数据中综合出信息并获得深刻的见解,能发现期望看到的信息并觉察出没有想到的信息,能提的见解,能发现期望看到的信息并觉察出没有想到的信息,能提供及时的、可理解的评价,在实际行动中能有效沟通。供及时的、可理解的评价,在实际行动中能有效沟通。可视化分析学是一个多学科领
23、域,涉及以下方面。可视化分析学是一个多学科领域,涉及以下方面。u 一是分析推理技术,它能使用户获得深刻的见解,这种见解直一是分析推理技术,它能使用户获得深刻的见解,这种见解直接支持评价、计划和决策的行为。接支持评价、计划和决策的行为。u 二是可视化表示和交互技术,它充分利用人眼的宽带宽通道的二是可视化表示和交互技术,它充分利用人眼的宽带宽通道的视觉能力,来观察、浏览和理解大量的信息。视觉能力,来观察、浏览和理解大量的信息。u 三是数据表示和变换,它以支持可视化分析的方式转化所有类三是数据表示和变换,它以支持可视化分析的方式转化所有类型的异构和动态数据。型的异构和动态数据。u 四是支持分析结果的
展开阅读全文