《商业智能:方法与应用》课件第8章 数据可视化.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《《商业智能:方法与应用》课件第8章 数据可视化.pptx》由用户(momomo)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 商业智能:方法与应用 商业智能:方法与应用课件第8章 数据可视化 商业 智能 方法 应用 课件 数据 可视化
- 资源描述:
-
1、6.1 数据可视化概述6.2 数据可视化的基本形式6.3 可视化工具介绍6.1.1 数据可视化的发展历程6.1.2 数据可视化定义目 录O N T E N T S6.3.1 常用可视化工具 6.3.2 Tableau简介 6.1.3 数据可视化流程6.1 数据可视化概述数据可视化的发展历程数据可视化定义数据可视化流程6.1.1 数据可视化的发展历程16世纪,精确观测数据变化的物理理论技术和相关的仪器已经逐渐被发明,而且手工绘制的可视化图表也逐渐出现。17世纪,物理学基本量的测量理论完善,这些理论和技术广泛应用于测绘技术、航空航海数据分析、国土勘察技术等相关领域。同时,地图学理论和实践也得到了迅
2、速的发展,人类对可视化开始了一种新的思维模式。18世纪是统计图形的繁荣期,人们创造了更好的图形类型和其他物理信息的概念图,抽象概念图和函数图得到了广泛的应用。19世纪上半叶,统计图形、概念图等开始迅猛爆发,此时已经有了一套完整的统计数据可视化工具。使用统计图表来帮助思考的诞生,从而派生出一个新视觉思维方式。19世纪后期,可视化方法建设的条件不断成熟。数据测量与图表萌芽可视化技术的发展历程具体可以分为以下几个阶段:20世纪后,各种数据分析和可视化技术逐渐出现,特别是采用计算机编程技术来实现数据可视化。70年代后,可视化的数据来源越来越广泛,数据密集型计算开始产生实际需求。21世纪以后,需要分析和
3、表示的数据量激增,新的可视化分析方法进一步综合了可视化、图形、数据挖掘理论与方法,从结构庞大的数据中迅速找到有用的信息以便完成有效的决策支持。现阶段,不仅大数据随处可见,而且相应的可视化处理也随处可见。数据图形数据可视化17世纪前18-19世纪20世纪后6.1.2 数据可视化定义 一般认为:运用计算机的图像处理和图形学技术将数据绘制成图像,借此增强人的感知和认知能力的技术称为数据可视化。数据可视化不仅包含计算机图形学技术,还包含人机交互和可视化算法等技术。计算机通过对采集的海量数据进行分析与处理,使其转变为易于被人所理解的图形、图像或者视频,人还可以通过交互界面与其进行交互,发现隐含在数据背后
4、的规律,将之运用于社会生产和经营活动,从而提高社会效率。数据可视化6.1.2 数据可视化定义信息可视化主要针对高维、抽象、非结构化的数据。信息可视化根据实际的数据分析需求,在二维空间中呈现数据,使人能够发现其中所蕴含的信息。核心问题是对高维数据进行可视化、对数据间的关系进行可视化以及对于可视化的结果进行有效性判断等。数据可视化最成熟的领域,主要应用于物理、化学、医药医学与航空航天等自然科学领域。科学可视化的主要目标在于寻找数据中的模式,核心问题是怎样呈现数据中的演化规律和形状特征。可视分析以可视化交互为基础,不仅包含了数据可视化和数据分析,还包含了数据挖掘与人机交互等领域。可视分析通过数据可视
5、化交互界面与其进行互补,完成有价值的分析与预测。核心问题在于对数据的分析与推理,在于人的思维与机器智能的双向互动。数据可视化主要可以分为三个发展方向,分别是信息可视化、科学可视化与可视分析。科学可视化6.1.3 数据可视化流程 可视化过程以数据流为主线,其主要模块包括数据采集、数据处理与转换、可视化映射和用户感知。整个可视化过程可以看作是数据流经一系列处理模块并进行转换的过程。可视化流程如图所示。数可视化社会活动、现象数据收集数据筛选及处理可视化处理用户感知知识、灵感反馈6.1.3 数据可视化流程数据收集 数据是可视化的对象。数据可以通过采样、调查记录、模拟实验等不同的方式进行采集。数据采集直
6、接决定了数据的格式、大小、精度等重要属性,在很大程度上决定了可视化结果的质量。数据筛选及处理 即数据预处理。将原始数据转换为用户能够理解和显示的模式和特性。这个过程包括去误差、数据清理和筛选、提取特征值等,为之后的可视化映射做好准备。可视化处理 可视化处理是整个可视化过程的核心,将各种类型的数据通过不同方式的连接和用不同的显示方式展示出来。最终目的是将数据中包含的信息或者隐含在数据中的规律现象等显现出来,提高数据的可读性,使用户可以更好地理解数据和应用数据。用户感知 用户感知就是将数据进行可视化处理后,用户从中获得信息、知识和感悟等。用户根据自己的主观需求,在可视化图表中找到需要的信息并得出自
7、己的结果,这可帮助他们获得需要的知识,可以对数据有更深入的见解,也便于更加深入的对数据进行分析。6.2 数据可视化的基本形式直方图饼图标签云折线图箱图雷达图气泡图关系图热图6.2 数据可视化的基本形式1.直方图 直方图(Histogram)又称柱状图,是一种统计报告图,由一系列高度不等的纵向条纹或线段表示数据分布的情况。一般用横轴表示数据类型,纵轴表示分布情况。直方图是数值数据分布的精确图形表示,是一个连续变量的概率分布的估计,它是一种条形图。6.2 数据可视化的基本形式2.饼图 饼图(Sector Graph)常用于展示数据系列中各项的大小与各项总和的比例关系。2D饼图为圆形,仅排列在工作表
8、的一列或一行中的数据可以绘制到饼图中。饼图中的数据点显示为饼图中的百分比。6.2 数据可视化的基本形式3.折线图 折线图可以显示随时间而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势。在折线图中,类别数据沿水平轴均匀分布,所有值数据沿垂直轴均匀分布。如果分类标签是文本并且代表均匀分布的数值,则应该使用折线图。当有多个系列时,尤其适合使用折线图,可以看出不同系列数据之间的差别。6.2 数据可视化的基本形式4.箱图 箱图是一种显示数据离散状态的分析图形。箱图主要包含6个数据节点:上限、下限、上四分位、中位数、下四分位和异常值。箱图更容易识别数据异常。箱图将多批数据放同一数据轴上,并排
9、排列进行对比,使得样本数据特征的分析变得更加容易。常用于股票市场分析的K线图就是类似箱图的一种应用。6.2 数据可视化的基本形式5.雷达图 雷达图是一种应用于多维数据分析的图形,通过对多维数据进行分析,来探索问题的相关状态。通常维度应大于或等于四维。雷达图使用的样本数据,应该由一个或多个定性变量和多个连续型变量组成,因而雷达图能够进行多元多维度比较,更加形象直观地反映出数据特征。如果只是一组连续型变量,则更适合选择箱图来绘制图形。6.2 数据可视化的基本形式6.标签云 标签云是关键词的视觉化描述,表现一套标签和与其对应的权重。一般的标签云含有30-150个标签,每个标签对应的权重影响标签的属性
展开阅读全文