书签 分享 收藏 举报 版权申诉 / 52
上传文档赚钱

类型大数据导论第7章-数据可视化课件.pptx

  • 上传人(卖家):三亚风情
  • 文档编号:3429020
  • 上传时间:2022-08-30
  • 格式:PPTX
  • 页数:52
  • 大小:5.43MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《大数据导论第7章-数据可视化课件.pptx》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    数据 导论 可视化 课件
    资源描述:

    1、数据中国“百校工程”项目系列教材数据科学与大数据技术专业系列规划教材第7章 数据可视化 本章主要内容如下。本章主要内容如下。(1 1)可视化的含义。)可视化的含义。(2 2)可视化的发展历程。)可视化的发展历程。(3 3)可视化的作用。)可视化的作用。(4 4)数据可视化分类。)数据可视化分类。(5 5)数据可视化工具。)数据可视化工具。7.1 什么是可视化7.1.1 7.1.1 可视化的含义可视化的含义 测量的自动化、网络传输过程的数字化和大量的计算机仿真产测量的自动化、网络传输过程的数字化和大量的计算机仿真产生了海量数据,超出了人类大脑分析处理的能力。生了海量数据,超出了人类大脑分析处理的

    2、能力。可视化(可视化(VisualizationVisualization)提供了解决这种问题的一种新方法。)提供了解决这种问题的一种新方法。一般意义下的可视化的定义:可视化是一种使复杂信息能够容易和一般意义下的可视化的定义:可视化是一种使复杂信息能够容易和快速被人理解的手段,是一种聚焦在信息重要特征的信息压缩,是快速被人理解的手段,是一种聚焦在信息重要特征的信息压缩,是可以放大人类感知的图形化表示方法。可以放大人类感知的图形化表示方法。可视化就是把数据、信息和知识转化为可视的表示形式并获可视化就是把数据、信息和知识转化为可视的表示形式并获得对数据更深层次认识的过程。可视化作为一种可以放大人类

    3、感得对数据更深层次认识的过程。可视化作为一种可以放大人类感知的数据、信息、知识的表示方法,日益受到重视并得到越来越知的数据、信息、知识的表示方法,日益受到重视并得到越来越广泛的应用。可视化可以应用到简单问题,也可以应用到复杂系广泛的应用。可视化可以应用到简单问题,也可以应用到复杂系统状态表示问题。人们可以从可视化的表示中发现新的线索、新统状态表示问题。人们可以从可视化的表示中发现新的线索、新的关联、新的结构、新的知识,促进人机系统的结合,促进科学的关联、新的结构、新的知识,促进人机系统的结合,促进科学决策。决策。可视化充分利用计算机图形学、图像处理、用户界面、人机可视化充分利用计算机图形学、图

    4、像处理、用户界面、人机交互等技术,形象、直观地显示科学计算的中间结果和最终结果交互等技术,形象、直观地显示科学计算的中间结果和最终结果并进行交互处理。可视化技术以人们惯于接受的表格、图形、图并进行交互处理。可视化技术以人们惯于接受的表格、图形、图像等方法并辅以信息处理技术将客观事物及其内在的联系进行表像等方法并辅以信息处理技术将客观事物及其内在的联系进行表现,可视化结果便于人们记忆和理解。现,可视化结果便于人们记忆和理解。可视化为人类大脑与计算机这两个信息处理系统之间提供了可视化为人类大脑与计算机这两个信息处理系统之间提供了一个接口。可视化对信息的处理和表达方式有其他方式无法取代一个接口。可视

    5、化对信息的处理和表达方式有其他方式无法取代的优势,其特点可总结为可视性、交互性和多维性。的优势,其特点可总结为可视性、交互性和多维性。7.1.2 7.1.2 可视化的发展历程可视化的发展历程 可视化技术使人能在三维图形世界中直接对具有形体的信息可视化技术使人能在三维图形世界中直接对具有形体的信息进行操作,和计算机直接交流。这种技术已经把人和机器的力量进行操作,和计算机直接交流。这种技术已经把人和机器的力量以一种直觉而自然的方式加以联系,这种革命性的变化无疑将极以一种直觉而自然的方式加以联系,这种革命性的变化无疑将极大地提高人们的工作效率。可视化技术赋予人们一种仿真的、三大地提高人们的工作效率。

    6、可视化技术赋予人们一种仿真的、三维的并且具有实时交互的能力,这样人们可以在三维图形世界中维的并且具有实时交互的能力,这样人们可以在三维图形世界中用以前不可想象的手段来获取信息或发挥自己创造性的思维。用以前不可想象的手段来获取信息或发挥自己创造性的思维。人们对计算机可视化技术的研究已经历了一个很长的历程,人们对计算机可视化技术的研究已经历了一个很长的历程,而且形成了许多可视化工具,其中而且形成了许多可视化工具,其中SGISGI公司推出的公司推出的GLGL三维图形库表三维图形库表现突出,其易于使用而且功能强大。利用现突出,其易于使用而且功能强大。利用GLGL开发出来的三维应用开发出来的三维应用软件

    7、颇受许多专业技术人员的喜爱,这些三维应用软件已涉及建软件颇受许多专业技术人员的喜爱,这些三维应用软件已涉及建筑、产品设计、医学、地球科学、流体力学等领域。筑、产品设计、医学、地球科学、流体力学等领域。随着计算机技术的发展,随着计算机技术的发展,GLGL已经进一步发展成为已经进一步发展成为OpenGLOpenGL。OpenGLOpenGL已被认为是高性能图形和交互式视觉处理的标准,在计算已被认为是高性能图形和交互式视觉处理的标准,在计算机领域被广泛采用。机领域被广泛采用。7.1.3 7.1.3 可视化的作用可视化的作用1 1可视化后的信息易于理解可视化后的信息易于理解2 2以建设性方式讨论结果以

    8、建设性方式讨论结果3 3理解运营和结果之间的连接理解运营和结果之间的连接4 4发现新兴趋势发现新兴趋势5 5与数据交互与数据交互7.2 数据可视化及其分类 数据可视化是可视化技术针对大型关系型数据库或数据仓库数据可视化是可视化技术针对大型关系型数据库或数据仓库的应用,它旨在用图形和图像的方式展示大型数据库中的多维数的应用,它旨在用图形和图像的方式展示大型数据库中的多维数据,并且以可视化的形式反映对多维数据的分析及内涵信息的挖据,并且以可视化的形式反映对多维数据的分析及内涵信息的挖掘。数据可视化技术凭借计算机的巨大处理能力、计算机图像和掘。数据可视化技术凭借计算机的巨大处理能力、计算机图像和图形

    9、学基本算法,以及可视化算法,把海量的数据转化为静态或图形学基本算法,以及可视化算法,把海量的数据转化为静态或动态图并呈现在人们的面前,并允许通过交互手段控制数据的抽动态图并呈现在人们的面前,并允许通过交互手段控制数据的抽取和画面的显示,使隐含于数据之中不可见的现象变得可见,为取和画面的显示,使隐含于数据之中不可见的现象变得可见,为人们分析、理解数据、形成概念、找出规律提供了强有力的手段。人们分析、理解数据、形成概念、找出规律提供了强有力的手段。数据可视化技术诞生于数据可视化技术诞生于2020世纪世纪8080年代,是运用计算机图形学和年代,是运用计算机图形学和图像处理等技术,以图表、地图、动画或

    10、其他使内容更容易理解的图像处理等技术,以图表、地图、动画或其他使内容更容易理解的图形方式来表示数据,使数据所表达的内容更容易被处理。数据可图形方式来表示数据,使数据所表达的内容更容易被处理。数据可视化技术与虚拟现实技术、数据挖掘、人工智能,甚至与人类基因视化技术与虚拟现实技术、数据挖掘、人工智能,甚至与人类基因组计划等前沿学科领域都有着密切的联系。组计划等前沿学科领域都有着密切的联系。从纯技术角度来看,数据可视化大体可以分为从纯技术角度来看,数据可视化大体可以分为5 5类:基于几何类:基于几何投影的数据可视化、面向像素的数据可视化、基于图标的数据可视投影的数据可视化、面向像素的数据可视化、基于

    11、图标的数据可视化、基于层次的数据可视化及基于图形的数据可视化。化、基于层次的数据可视化及基于图形的数据可视化。从实用角度来看,数据可视化大体可以分为从实用角度来看,数据可视化大体可以分为3 3类:科学可视化、类:科学可视化、信息可视化和可视化分析学。信息可视化和可视化分析学。7.2.1 7.2.1 科学可视化科学可视化 1987 1987年,在华盛顿召开的一次科学计算会议上,针对大数据处年,在华盛顿召开的一次科学计算会议上,针对大数据处理问题,美国计算机成像专业委员会提出了解决方案:可视化理问题,美国计算机成像专业委员会提出了解决方案:可视化用图形和图像解释数据。这次会议形成了题为用图形和图像

    12、解释数据。这次会议形成了题为“科学计算可视化科学计算可视化”的报告,后被称为科学可视化(的报告,后被称为科学可视化(Scientific VisualizationScientific Visualization,SVSV)。)。1 1可视化是一种计算方法可视化是一种计算方法 可视化用图形来描述物理现象,把数学符号转化成几何图形,可视化用图形来描述物理现象,把数学符号转化成几何图形,以直观、形象的方式来表达数据,显示数据中所包含的信息,使以直观、形象的方式来表达数据,显示数据中所包含的信息,使科学家和工程技术人员能有效地观察、模拟和计算,并进行交互科学家和工程技术人员能有效地观察、模拟和计算,

    13、并进行交互控制。科学可视化包括图像生成和图像理解两个部分,它既是由控制。科学可视化包括图像生成和图像理解两个部分,它既是由复杂多维数据集产生图像的工具,又是解释输入计算机的图像数复杂多维数据集产生图像的工具,又是解释输入计算机的图像数据的手段。它得到以下几个相对独立的学科的支持:计算机图形据的手段。它得到以下几个相对独立的学科的支持:计算机图形学、图像处理、计算机视觉、计算机辅助设计、信号处理、图形学、图像处理、计算机视觉、计算机辅助设计、信号处理、图形用户界面及交互技术。用户界面及交互技术。2 2可视化所研究的课题就是人与计算机之间的交互机制可视化所研究的课题就是人与计算机之间的交互机制 可

    14、视化应使人与计算机协同地感知、利用和传递视觉信息。可视化应使人与计算机协同地感知、利用和传递视觉信息。科学可视化按功能划分为如下科学可视化按功能划分为如下3 3种形式。种形式。(1 1)事后处理方式。计算和可视化是分成两个阶段进行的,两者)事后处理方式。计算和可视化是分成两个阶段进行的,两者之间不进行交互作用。之间不进行交互作用。(2 2)追踪方式。可将计算结果即时以图像显示,以使研究人员了)追踪方式。可将计算结果即时以图像显示,以使研究人员了解当前的计算情况,决定计算是否继续。解当前的计算情况,决定计算是否继续。(3 3)驾驭方式。这是科学可视化的最高形式。研究人员可参与计)驾驭方式。这是科

    15、学可视化的最高形式。研究人员可参与计算过程,对计算进行实时干预。算过程,对计算进行实时干预。3 3科学可视化的应用范围包括当代科学技术的各个领域科学可视化的应用范围包括当代科学技术的各个领域 其中,典型的领域如下。其中,典型的领域如下。(1 1)科学研究:分子模型、医学图像、数学、地球科学、空间探)科学研究:分子模型、医学图像、数学、地球科学、空间探索及天体物索及天体物 理学。理学。(2 2)工程计算:计算流体力学和有限元分析。)工程计算:计算流体力学和有限元分析。4 4当前科学计算可视化技术的发展特点当前科学计算可视化技术的发展特点(1 1)可视化图像的实时显示及交互控制)可视化图像的实时显

    16、示及交互控制(2 2)网络环境下实现的科学计算可视化)网络环境下实现的科学计算可视化(3 3)虚拟环境下实现的科学计算可视化)虚拟环境下实现的科学计算可视化7.2.2 7.2.2 信息可视化信息可视化 信息可视化(信息可视化(Information VisualizationInformation Visualization,InfoVisInfoVis)是情)是情报学领域一个较新的研究热点。国外信息管理与信息系统专业、报学领域一个较新的研究热点。国外信息管理与信息系统专业、图书情报学专业对这一领域的研究非常活跃,一些大学的信息管图书情报学专业对这一领域的研究非常活跃,一些大学的信息管理类专业

    17、开设了这方面的课程。对信息可视化技术进行分类,可理类专业开设了这方面的课程。对信息可视化技术进行分类,可以对其方法和应用目的更加明确,从而帮助用户针对问题和应用以对其方法和应用目的更加明确,从而帮助用户针对问题和应用领域选择合适的可视化技术;同时,可以发现现有可视化研究的领域选择合适的可视化技术;同时,可以发现现有可视化研究的不足,从而促使研究人员开发更新的可视化技术。不足,从而促使研究人员开发更新的可视化技术。在可视化领域,一般将信息数据分为如下在可视化领域,一般将信息数据分为如下6 6类。类。1 1一维数据一维数据 这类数据以一维向量为主,只具有单一属性,主要用来表征这类数据以一维向量为主

    18、,只具有单一属性,主要用来表征数值、时间、方向等具有射线属性的一维坐标信息。数值、时间、方向等具有射线属性的一维坐标信息。2 2尺寸数据尺寸数据 这类数据主要出现在平面设计、地理图件和地理信息系统相这类数据主要出现在平面设计、地理图件和地理信息系统相关的应用领域,一般采用横纵坐标法呈现其数据,可以充分将横关的应用领域,一般采用横纵坐标法呈现其数据,可以充分将横向和纵向的位置信息显现出来,并且可以利用相应的位置坐标数向和纵向的位置信息显现出来,并且可以利用相应的位置坐标数据做空间信息计算,如求最短路程、最小面积和最小高程等。据做空间信息计算,如求最短路程、最小面积和最小高程等。3 3三维数据三维

    19、数据 三维数据包含三维数据包含3 3个维度的属性信息,能够更加立体和直观地展个维度的属性信息,能够更加立体和直观地展示事物的立体属性和物理状态。该数据类型的应用领域比较广泛,示事物的立体属性和物理状态。该数据类型的应用领域比较广泛,我们熟知的医学、地质、气象、工业工程设计等领域都离不开三我们熟知的医学、地质、气象、工业工程设计等领域都离不开三维数据类型的支撑。维数据类型的支撑。4 4多维数据多维数据 这类数据包含这类数据包含4 4个或个或4 4个以上的属性信息,主要用于分析多维个以上的属性信息,主要用于分析多维数据内部属性的关联和相互关系。该类数据以财务与统计数据为数据内部属性的关联和相互关系

    20、。该类数据以财务与统计数据为主,主要用于分析过往的财务状况,预测未来的可能的发展趋势主,主要用于分析过往的财务状况,预测未来的可能的发展趋势等。这是信息可视化研究的一个重要方向。等。这是信息可视化研究的一个重要方向。5 5分层数据分层数据 分层数据模型是一种抽象的分类数据集合模式,是比较常见分层数据模型是一种抽象的分类数据集合模式,是比较常见的数据关系。传统的图书馆资源管理模型和窗口系统资源管理模的数据关系。传统的图书馆资源管理模型和窗口系统资源管理模型使用的就是典型的分层数据,这类模型将现实的事务管理做分型使用的就是典型的分层数据,这类模型将现实的事务管理做分层、分类处理,以达到科学、高效管

    21、理的目的。层、分类处理,以达到科学、高效管理的目的。6 6文本数据文本数据 这类数据形式多样,如报纸、邮件、新闻等信息都可以作为这类数据形式多样,如报纸、邮件、新闻等信息都可以作为文本数据。有大量多媒体和超文本信息的互联网成为文本数据的文本数据。有大量多媒体和超文本信息的互联网成为文本数据的较大来源之一。较大来源之一。7.2.3 7.2.3 可视化分析学可视化分析学 可视化分析学是通过交互式可视化界面促进分析推理的一门可视化分析学是通过交互式可视化界面促进分析推理的一门科学。可视化分析学尤其关注的是意会和推理,科学可视化处理科学。可视化分析学尤其关注的是意会和推理,科学可视化处理的是那些具有天

    22、然几何结构的数据,信息可视化处理的是抽象数的是那些具有天然几何结构的数据,信息可视化处理的是抽象数据结构,如树状结构或图形。据结构,如树状结构或图形。人们可以利用可视化分析工具从海量、多维、多源、动态、人们可以利用可视化分析工具从海量、多维、多源、动态、时滞、异构、含糊不清甚至矛盾的数据中综合出信息并获得深刻时滞、异构、含糊不清甚至矛盾的数据中综合出信息并获得深刻的见解,能发现期望看到的信息并觉察出没有想到的信息,能提的见解,能发现期望看到的信息并觉察出没有想到的信息,能提供及时的、可理解的评价,在实际行动中能有效沟通。供及时的、可理解的评价,在实际行动中能有效沟通。可视化分析学是一个多学科领

    23、域,涉及以下方面。可视化分析学是一个多学科领域,涉及以下方面。u 一是分析推理技术,它能使用户获得深刻的见解,这种见解直一是分析推理技术,它能使用户获得深刻的见解,这种见解直接支持评价、计划和决策的行为。接支持评价、计划和决策的行为。u 二是可视化表示和交互技术,它充分利用人眼的宽带宽通道的二是可视化表示和交互技术,它充分利用人眼的宽带宽通道的视觉能力,来观察、浏览和理解大量的信息。视觉能力,来观察、浏览和理解大量的信息。u 三是数据表示和变换,它以支持可视化分析的方式转化所有类三是数据表示和变换,它以支持可视化分析的方式转化所有类型的异构和动态数据。型的异构和动态数据。u 四是支持分析结果的

    24、产生、演示和传播的技术,它能与各种观四是支持分析结果的产生、演示和传播的技术,它能与各种观众交流有适当背景资料的信息。众交流有适当背景资料的信息。7.3 数据可视化工具 数据可视化工具必须具备的特性如下。数据可视化工具必须具备的特性如下。1 1实时性实时性2 2简单操作简单操作3 3更丰富的展现方式更丰富的展现方式4 4多种数据集成支持方式多种数据集成支持方式7.3.1 7.3.1 入门级工具入门级工具 Excel Excel作为一个入门级工具,是快速分析数据的理想工具,也作为一个入门级工具,是快速分析数据的理想工具,也能创建供内部使用的数据图,但是能创建供内部使用的数据图,但是ExcelEx

    25、cel在颜色、线条和样式上可在颜色、线条和样式上可选择的范围有限,这也意味着用选择的范围有限,这也意味着用ExcelExcel很难制作出能符合专业出版很难制作出能符合专业出版物和网站需要的数据图。物和网站需要的数据图。数据可视化包含简单图形、动态图表、数据地图和数据动态数据可视化包含简单图形、动态图表、数据地图和数据动态视频等,可以用很多专业软件制作,但这需要专业知识,要熟悉视频等,可以用很多专业软件制作,但这需要专业知识,要熟悉编程语言,还要购买专用软件并安装,才能实现数据可视化的效编程语言,还要购买专用软件并安装,才能实现数据可视化的效果。果。7.3.2 7.3.2 信息图表工具信息图表工

    26、具 信息图表是对各种信息进行形象化、可视化加工的一种工具。信息图表是对各种信息进行形象化、可视化加工的一种工具。根据道格根据道格纽瑟姆(纽瑟姆(Doug NewsomDoug Newsom)的概括,作为视觉化工具的信)的概括,作为视觉化工具的信息图表包括图表(息图表包括图表(chartchart)、图解()、图解(diagramdiagram)、图形()、图形(graphgraph)、)、表格(表格(tabletable)、地图()、地图(mapmap)和列表()和列表(listlist)等。下面介绍)等。下面介绍8 8种信种信息图表工具。息图表工具。1 1VisemVisem Visem V

    27、isem是一款包含大量素材的免费信息图表工具,如图是一款包含大量素材的免费信息图表工具,如图7-17-1所所示。用户可以借助它示。用户可以借助它“直观地呈现直观地呈现”复杂的数据。无论用它来构复杂的数据。无论用它来构建演示文稿,还是创建有趣的图表,这款工具都是可以胜任的。建演示文稿,还是创建有趣的图表,这款工具都是可以胜任的。其中包含其中包含100100个风格各异的免费字体,还有数千张高质量的图片。个风格各异的免费字体,还有数千张高质量的图片。图7-1 Visem可视化工具2 2CanvaCanva Canva Canva是目前最著名的信息图制作工具,如图是目前最著名的信息图制作工具,如图7-

    28、27-2所示。它是所示。它是一款便捷的在线信息图表设计工具,适用于各种设计任务(从制一款便捷的在线信息图表设计工具,适用于各种设计任务(从制作小册子到制作演示文稿),还为用户提供庞大的图片素材库、作小册子到制作演示文稿),还为用户提供庞大的图片素材库、图标合集和字体库。图标合集和字体库。图7-2 Canva可视化工具3 3Google ChartsGoogle Charts Google Charts Google Charts不仅可以帮用户设计信息图表,甚至可以帮用不仅可以帮用户设计信息图表,甚至可以帮用户展示实时的数据,如图户展示实时的数据,如图7-37-3所示。作为一款信息图表的设计工具

    29、,所示。作为一款信息图表的设计工具,Google ChartsGoogle Charts内置了大量可供用户控制和选择的选项,用来生成内置了大量可供用户控制和选择的选项,用来生成足以让用户满意的图表。通过来自足以让用户满意的图表。通过来自GoogleGoogle公司的实时数据的支撑,公司的实时数据的支撑,Google ChartsGoogle Charts的功能比用户想象的更加强大和全面。的功能比用户想象的更加强大和全面。图7-3 Google Charts可视化工具4 4PiktochartPiktochart Piktochart Piktochart是一款信息图表设计和展示工具,如图是一款

    30、信息图表设计和展示工具,如图7-47-4所示。所示。用户所需要做的,只是单击几下鼠标,就可以将无聊的数据转化用户所需要做的,只是单击几下鼠标,就可以将无聊的数据转化为有趣的图表。为有趣的图表。Piktochart Piktochart 的自定义编辑器能够让用户修改配色的自定义编辑器能够让用户修改配色方案和字体,插入预先设计的图形或者图片,内置的栅格系统能方案和字体,插入预先设计的图形或者图片,内置的栅格系统能够帮用户更好地对齐和控制排版布局,功能上够用且便捷无比。够帮用户更好地对齐和控制排版布局,功能上够用且便捷无比。图7-4 Piktochart可视化工具5 5InfogramInfogra

    31、m Infogram Infogram算是老牌信息图表设计工具了,它同样是免费的,如算是老牌信息图表设计工具了,它同样是免费的,如图图7-57-5所示。它内置大量的图表样式供用户使用,允许上传图片和所示。它内置大量的图表样式供用户使用,允许上传图片和视频,可以像视频,可以像ExcelExcel一样输入,然后生成不同样式的设计。这款工一样输入,然后生成不同样式的设计。这款工具能够自动地调整信息图表的外观,以匹配不同类型的数据,更好具能够自动地调整信息图表的外观,以匹配不同类型的数据,更好地展示。地展示。图7-5 Infogram可视化工具6 6VenngageVenngage Venngage

    32、Venngage同样是一款颇为优秀的信息图表设计和发布工具,其同样是一款颇为优秀的信息图表设计和发布工具,其最突出的特性是最突出的特性是“易用性易用性”,如图,如图7-67-6所示。用户可以在所示。用户可以在VenngageVenngage内内置的各种模板的基础上制作信息图表,其内置的模板、上百个图表置的各种模板的基础上制作信息图表,其内置的模板、上百个图表和图标样式可以让用户结合自己的图片素材生成足以匹配需求的信和图标样式可以让用户结合自己的图片素材生成足以匹配需求的信息图表。同样,用户可以生成信息动画,让自己的数据更好地呈现息图表。同样,用户可以生成信息动画,让自己的数据更好地呈现出来。出

    33、来。图7-6 Venngage可视化工具7 7Easel.lyEasel.ly Easel.ly Easel.ly是一款免费的信息图表设计工具,如图是一款免费的信息图表设计工具,如图7-77-7所示。它是所示。它是基于网站来为用户提供信息图表设计服务的,内置模板,允许用户轻基于网站来为用户提供信息图表设计服务的,内置模板,允许用户轻松定制。它内置诸如箭头这样基本的图形、各种图表和图标,以及自松定制。它内置诸如箭头这样基本的图形、各种图表和图标,以及自定义字体色彩这种不可或缺的功能模块,用户可以上传各种自制的素定义字体色彩这种不可或缺的功能模块,用户可以上传各种自制的素材来完善设计。材来完善设计

    34、。图7-7 Ease.ly可视化工具7.3.3 7.3.3 地图工具地图工具1 1MapShaperMapShaper MapShaper MapShaper适用的数据形式不再是一般人都能看懂的表格,而适用的数据形式不再是一般人都能看懂的表格,而是需要特定的格式,包括是需要特定的格式,包括shapefilesshapefiles(文件名一般以(文件名一般以.shp.shp作为后作为后缀)、缀)、geoJSONgeoJSON(一种开源的地理信息代码,用于描述位置和形状)(一种开源的地理信息代码,用于描述位置和形状)及及topoJSONtopoJSON(geoJSONgeoJSON的衍生格式,主要

    35、用于拓扑形状,比较有趣的衍生格式,主要用于拓扑形状,比较有趣的应用案例是以人口规模作为面积重新绘制行政区域的形状和大的应用案例是以人口规模作为面积重新绘制行政区域的形状和大小,这一类图被称为小,这一类图被称为cartogramcartogram)。)。对需要自定义地图中各区域边界和形状的制图师,对需要自定义地图中各区域边界和形状的制图师,MapShaperMapShaper是个极好的入门级工具,其简便性也有助于地图设计师随时检查是个极好的入门级工具,其简便性也有助于地图设计师随时检查数据是否与设计图相吻合,修改后还能够以多种格式输出,进一数据是否与设计图相吻合,修改后还能够以多种格式输出,进一

    36、步用于更复杂的可视化产品。可视化案例如图步用于更复杂的可视化产品。可视化案例如图7-87-8所示。所示。图7-8 用MapShaper制作的世界海底通信线缆2 2CartoDBCartoDB CartoDB CartoDB工具如图工具如图7-97-9所示,目前已经吸引所示,目前已经吸引1212万用户制作了超万用户制作了超过过4040万张地图。这些用户将世界上一些有趣的主题,如全球万张地图。这些用户将世界上一些有趣的主题,如全球“粉粉丝丝”对对BeyonceBeyonce最新专辑发布的实时反应等,变成互动性强、好玩最新专辑发布的实时反应等,变成互动性强、好玩的可视化作品。的可视化作品。图7-9

    37、CartoDB可视化工具3 3mapboxmapbox 可以说,可以说,mapboxmapbox(见图(见图7-107-10)是制图专业人士的工具,可以)是制图专业人士的工具,可以制作独一无二的地图,从马路的颜色到边境线都可以自行定义。制作独一无二的地图,从马路的颜色到边境线都可以自行定义。它是一个收费的商业产品,它是一个收费的商业产品,AirbnbAirbnb、PinterestPinterest等公司都是其客户。等公司都是其客户。图7-10 mapbox可视化工具4 4MapStackMapStack Map Stack Map Stack是由可视化设计机构是由可视化设计机构StamenS

    38、tamen(这家(这家“机构机构”自称既自称既非研究所又非公司,却以盈利为目的,非常独特)推出的免费地非研究所又非公司,却以盈利为目的,非常独特)推出的免费地图制作工具,简便易用,如图图制作工具,简便易用,如图7-117-11所示。所示。图7-11 Map Stack可视化工具7.3.4 7.3.4 高级分析工具高级分析工具1 1R R 数据可视化本身是一门复杂的学科,包含了很多方面,在数据可视化本身是一门复杂的学科,包含了很多方面,在R R中中实现的数据可视化,目前主要是数据的统计图展示。实现的数据可视化,目前主要是数据的统计图展示。展示分为低维数据的展示和多维数据的展示。由于展示分为低维数

    39、据的展示和多维数据的展示。由于ggplot2ggplot2图图形系统是形系统是R R中功能最强大的图形系统,使用中功能最强大的图形系统,使用ggplot2ggplot2展示的数据更加展示的数据更加美观和方便,因此本节在展示美观和方便,因此本节在展示R R中的各类统计图时选用中的各类统计图时选用ggplot2ggplot2图形图形系统。系统。在使用在使用ggplot2ggplot2之前,需要先安装并载入该包,代码如下。之前,需要先安装并载入该包,代码如下。使用使用R R语言绘制的散点图是数据点在直角坐标系平面上的分布语言绘制的散点图是数据点在直角坐标系平面上的分布图。它用于研究两个连续变量之间的

    40、关系,是一种最常见的统计图。它用于研究两个连续变量之间的关系,是一种最常见的统计图形,如图图形,如图7-127-12所示。所示。install.packages(ggplot2)library(ggplot2)图7-12 R语言散点图 使用使用R R语言绘制的直方图(语言绘制的直方图(HistogramHistogram)又被称为质量分布图,是一种统计报告图,又被称为质量分布图,是一种统计报告图,如图如图7-137-13所示。直方图由一系列高度不等的所示。直方图由一系列高度不等的纵向条纹或线段表示数据分布的情况,一般纵向条纹或线段表示数据分布的情况,一般用横轴表示数据类型,纵轴表示分布情况。用

    41、横轴表示数据类型,纵轴表示分布情况。图7-13 R语言直方图2 2D3D3 D3 D3的全称是的全称是Data-Driven DocumentsData-Driven Documents(数据驱动文档),是基(数据驱动文档),是基于数据的文档操作于数据的文档操作JavaScriptJavaScript库。库。D3D3能够把数据和能够把数据和HTMLHTML、SVGSVG、CSSCSS结合起来,创造出可交互的数据图表。其中,数据来源于作者,文结合起来,创造出可交互的数据图表。其中,数据来源于作者,文档代表基于档代表基于WebWeb的文档(或网页),也就是可以在浏览器中展现的的文档(或网页),也就

    42、是可以在浏览器中展现的一切(如一切(如HTMLHTML、SVGSVG等),而等),而D3D3相当于扮演了一个驱动程序的角色,相当于扮演了一个驱动程序的角色,将数据和文档联系起来。将数据和文档联系起来。D3.js D3.js采用链式语法,非常方便用户对库中函数方法的引用。采用链式语法,非常方便用户对库中函数方法的引用。3 3Python Python Python Python让用户很容易就能实现可视化让用户很容易就能实现可视化只需借助可视化的只需借助可视化的两个专属库(两个专属库(librarieslibraries)MatplotlibMatplotlib和和SeabornSeaborn。M

    43、atplotlib Matplotlib:基于:基于PythonPython的绘图库为的绘图库为MatplotlibMatplotlib提供了完整提供了完整的的2D2D图形和有限图形和有限3D3D图形支持。这对在跨平台互动环境中发布高质图形支持。这对在跨平台互动环境中发布高质量图片很有用。它也可用于动画。量图片很有用。它也可用于动画。Seaborn Seaborn是是PythonPython中用于创建丰富信息和有吸引力图表的统计中用于创建丰富信息和有吸引力图表的统计图形库。这个库是基于图形库。这个库是基于MatplotlibMatplotlib的。的。Seaborn Seaborn提供多种功能

    44、,如内置主题、调色板、函数和工具,提供多种功能,如内置主题、调色板、函数和工具,来实现单因素、双因素、线性回归、数据矩阵、统计时间序列等来实现单因素、双因素、线性回归、数据矩阵、统计时间序列等的可视化,以让我们来进一步构建复杂的可视化结果。的可视化,以让我们来进一步构建复杂的可视化结果。7.4 数据可视化案例7.4.1 7.4.1 数字美食数字美食 数字美食赢得了数字美食赢得了“The Dataviz“The Dataviz 项目金奖项目金奖”及及“杰出个体奖杰出个体奖”两个奖项,获奖者是两个奖项,获奖者是 Moritz Stefaner Moritz Stefaner,他是一名专注于研究数据

    45、可,他是一名专注于研究数据可视化的独立设计师。视化的独立设计师。数字美食是设计师用艺术与设计的手法展示美味佳肴的制作过数字美食是设计师用艺术与设计的手法展示美味佳肴的制作过程的一种尝试,如图程的一种尝试,如图7-147-14所示。设计师从某种特别的味道和口感,到所示。设计师从某种特别的味道和口感,到不同的温度与肌理,甚至于装盘时体现出来的每一个小小的烹饪细节,不同的温度与肌理,甚至于装盘时体现出来的每一个小小的烹饪细节,用用2D2D或或3D3D的方式,展现出各种不同的具体形象。的方式,展现出各种不同的具体形象。图7-14 数字美食7.4.2 7.4.2 空中的间谍空中的间谍 空中的间谍出自美国

    46、新闻网站空中的间谍出自美国新闻网站BuzzfeedBuzzfeed的两名编辑的两名编辑Peter Peter AldousAldous和和Charles SefieCharles Sefie。凭借空中的间谍,两人获得。凭借空中的间谍,两人获得“最美最美奖奖”和和“数据新闻金奖数据新闻金奖”两项大奖。两项大奖。空中的间谍详细展现了美国联邦调查局和国土安全局通过空中的间谍详细展现了美国联邦调查局和国土安全局通过飞机在美国各大城市进行空中监视的情况,如图飞机在美国各大城市进行空中监视的情况,如图7-157-15所示。所示。Buzzfeed Buzzfeed 通过分析航班实时追踪网站通过分析航班实时追踪网站Flightradar24Flightradar24从从20152015年年8 8月中旬到月中旬到1212月末的飞行器位置数据,绘制出了这张飞行轨迹图,月末的飞行器位置数据,绘制出了这张飞行轨迹图,且可以拖动时间进度条,以查看单架飞机的航线及每天的具体情且可以拖动时间进度条,以查看单架飞机的航线及每天的具体情况。况。图7-15 空中的间谍

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:大数据导论第7章-数据可视化课件.pptx
    链接地址:https://www.163wenku.com/p-3429020.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库