第6章 数据可视化.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第6章 数据可视化.pptx》由用户(无敌的果实)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第6章 数据可视化 数据 可视化
- 资源描述:
-
1、大数据导论目录6.1数据可视化类型6.2数据可视化基础6.3数据可视化评估6.4学生作品第6章 数据可视化大数据时代的数据复杂性更高,如数据的流模式获取、非结构化、语义的多重性等方面有所体现。数据可视化是指综合运用计算机图形学、图像、人机交互等技术,将采集或模拟的数据映射为可识别的图形、图像、视频或动画,并允许用户对数据进行交互分析的理论、方法和技术。数据可视化能将不可见现象转换为可见的图形符号,然后从中发现规律和获取知识。今天,为什么更需要数据可视化?原因:1,2,3,4,。简、见、值简、见、值查找设计中不协调的地方离完美差一点点企业报表企业驾驶舱学习目标实验准备实验准备软件软件Tablea
2、u安装安装网站:网站:获得一年免费使用权获得一年免费使用权加入加入Tableau社区,观看在线授课社区,观看在线授课采集数据及清洗采集数据及清洗产生至少产生至少3个以上工作簿,进一步设计仪表板个以上工作簿,进一步设计仪表板学生直播交流学生直播交流 16.1 数据可视化类型数据可视化类型科学可视化面向科学和工程领域数据,如含空间坐标和几何信息的三维空间测量数据、计算模拟数据和医学影像数据等,重点探索如何以几何、拓扑和形状特征来呈现数据中蕴含的规律。信息可视化的处理对象则是非结构化、非几何的抽象数据,如金融交易、社交网络和文本数据,其核心挑战是针对大尺度高维复杂数据如何减少视觉混淆对有用信息的干扰
3、。由于数据分析的重要性,将可视化与分析结合,形成一个新的学科:可视分析学。1.2.3.数据可视化类型科学可视化信息可视化科学可视化向量场可视化张量场可视化标量场可视化科学可视化类型可视分析学l标量指单个数值,标量场指每个数据点记录一个标量值。l标量值的来源分为两类:1.从扫描或测量设备获得,如医学断层扫描设备获取的CT,MRI三维影像 2.从计算机或机器仿真中获得,如核聚变模拟中产生的壁内温度分布。数据可视化类型科学可视化信息可视化科学可视化向量场可视化科学可视化类型可视分析学标量场可视化向量场每个采样点记录一个向量(一维数据)向量代表某个方向、趋势,例如实际测得的风向、旋涡;数据仿真计算得出
4、的速度和力等。在实际应用中,二维或三维流场是最常见的向量场,流场可视化是向量场可视化中最重要的组成部分。张量场可视化数据可视化类型科学可视化信息可视化科学可视化科学可视化类型可视分析学标量场可视化张量是矢量的推广:标量可看作0阶张量,矢量可看作1阶张量。张量场可视化向量场可视化张量场可视化方法可分为基于纹理、几何、拓扑三类。基于纹理的方法将张量场转换为一张或动态演化的图像(纹理),图释张量场的全局属性,其思路是将张量场简化为向量场,进而采用线积分法、噪声纹理法等方法显示。科学可视化应用软件3D Slicer数据可视化类型科学可视化信息可视化可视分析学3D Slicer是一个免费的、开源的、跨平
5、台的医学图像分析与可视化软件,广泛应用于科学研究与医学教育领域。Slicer支持Windows,Linux和Mac OSX等平台。slicer支持包括医学图像分割、配准在内的很多功能。如图6-1为使用3D Slicer的肺部效果图。图6-1 3D Slicer肺部效果图科学可视化应用软件ArcGIS数据可视化类型科学可视化信息可视化可视分析学ArcGIS是美国Esri公司开发的地理信息软件。ArcGIS通过基本的地图、地理信息,为用户通过方便快速的地理数据映射,并提供开发工具包为开发新的应用提供支持。ArcGIS可以将结果嵌入到Excel报表中,在微软office程序中插入地理信息数据显示。如
6、图6-2为ArcGIS绘制地理效果图。图6-2 ArcGIS绘制地理效果图科学可视化应用软件Visualization Toolkit数据可视化类型科学可视化信息可视化可视分析学Visualization Toolkit,简称VTK(http:/www.vtk.org/),是一个开源、跨平台的可视化应用函数库。它的主要维护者Kitware公司,创造了VTK,ITK,Cmake,ParaView等众多开源软件系统。VTK的设计目标是在三维图形绘制底层库OpenGL基础上,采用面向对象的设计方法,构建用于可视化应用程序的支撑环境。如图6-3为使用VTK绘制效果图。图6-3 VTK绘制效果图信息可视
7、化应用软件CiteSpace是由可视化专家Chaomei Chen 教授开发的一款文献分析的可视化软件,主要面向科研论文之间相互引用所构成的网络。citespace的数据来源于web of science,分析过程包括确定主题词和专业术语、收集数据、提取研究前沿术语、时区分割、阈值选择、显示、可视检测和验证关键点八个步骤。如图6-4为利用CiteSpace绘制效果图。CiteSpace数据可视化类型科学可视化信息可视化可视分析学图6-4 CiteSpace效果图信息可视化应用软件Data driven documents(D3)是一套面向Web的二维数据变换与可视化方法。它以轻量级的浏览器端应
8、用为目标,具有良好的可移植性。D3.js是基于D3规范的JavaScript库,基于HTML、SVG(向量图形)和CSS构建,前身是美国斯坦福大学研发的Protovis(目前已停止更新)。D3可以将任意数据绑定到一个DOM,并对文档实施基于数据的变换。例如,将一组数字生成为一个HTML表,或用相同的数据生成一个可交互的SVG条形图。如图6-5为D3工具绘制的各类可视化效果图。D3数据可视化类型科学可视化信息可视化可视分析学图6-5 D3绘制可视化效果图信息可视化应用软件Gephi是一个应用于各种网络、复杂系统和动态分层图的交互可视化和探索平台,支持Windows,Linux和Mac等各种操作系
9、统。可用于探索性数据分析、链接分析、社交网络分析和生物网络分析等,其设计初衷是采用简洁的点和线描绘与呈现丰富的世界。如图6-6为Gephi工具的可视化效果图。Gephi数据可视化类型科学可视化信息可视化可视分析学图6-6 Gephi可视化效果图数据可视化类型科学可视化信息可视化可视分析学可视分析学 可视分析学被定义为一门由可视交互界面为基础的分析推理科学由可视交互界面为基础的分析推理科学。它综合图形学、数据挖掘和人机交互等技术,如图6-7(a)所示。可视分析学可看成将可视化、人的因素和数据分析集成在内将可视化、人的因素和数据分析集成在内的一种新思路。如图6-7(b)所示,诠释了可视分析学包含的
10、研究内容。图6-7 可视分析学(a)可视分析的学科交叉组成(b)可视分析学涉及的学科可视分析学软件GapMinderTrendalyzer是瑞士Gapminder基金会开发的一个用于分析时变多变量数据变化趋势的可视分析软件。它采用互动的可视化形式动态地展示了世界各地、各机构公开的各项人文、政治、经济和发展指数,在信息产业界产生了积极的影响。如图6-8所示为GapMinder工具可视化效果图。GapMinder数据可视化类型科学可视化信息可视化可视分析学图6-8 GapMinder工具可视化效果图可视分析学软件Google Public Data Explorer 使用Google的datase
11、t publishing language(DSPL)数据发布语言,支持各类数据库链接,进行可视化的定制。它的优点是上传接口简单易行,所有操作都在网页上完成,而可视化的结果则用Flash的形式展现,并且允许用户嵌入到第三方网站中或者分享给其他用户,基本满足普通用户的统计数据分析需求。Google Public Data Explorer数据可视化类型科学可视化信息可视化可视分析学Palantir是可视分析领域的标杆性软件,为政府机构和金融机构提供高级数据分析服务。Palantir的主要功能是链接网络各类数据源,提供交互的可视化界面,辅助用户发现数据间的关键联系,寻找隐藏的规律或证据,并预测将来
12、可能发生的事件。Palantir26.2 数据可视化基础数据可视化基础数据可视化流程数据处理和变换视觉编码统计图表视觉隐喻数据可视化流程 数据采集:数据是可视化的对象。数据的采集直接决定了数据的格式、维度、尺寸、分辨率和精确度等重要性质,并在很大程度上决定了可视化结果的质量。数据处理和变换:数据的处理和变换可以认为是可视化的前期处理。一方面原始数据不可避免含有噪声和误差。另一方面,数据的模式和特征往往被隐藏。可视化映射:可视化映射是整个可视化流程的核心。该步骤将数据的数值、空间坐标、不同位置数据间的联系等映射为可视化视觉通道的不同元素,如标记、位置、形状、大小和颜色等。用户感知:用户感知从数据
13、的可视化结果中提取信息、知识和灵感。可视化映射后的结果只有通过用户感知才能转换成知识和灵感。用户的目标任务可分成三类:生成假设、验证假设和视觉呈现。数据滤波器在信号处理中的作用是从数据信号中去除不需要的部分。在可视化中常采用数据滤波来去燥。事实上,在数据采集的过程中噪声不可避免。如果数据来源于传感器,那么仪器的误差和环境中的光、电、磁信号噪声会造成数据中的噪声。如果数据源于模拟计算,则初始数据、计算参数、计算网格的不确定性和数值计算精度的限制会造成数据中的噪声。这些噪声在可视化中会覆盖数据本身的特征,形成对用户的误导。数据滤波数据可视化基础数据可视化流程数据处理和变换视觉编码统计图表视觉隐喻数
展开阅读全文