《多元统计分析》课件第02章-多变量的可视化.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《《多元统计分析》课件第02章-多变量的可视化.ppt》由用户(momomo)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元统计分析 多元 统计分析 课件 02 多变 可视化
- 资源描述:
-
1、主要分为两类:一类是使高维空间的主要分为两类:一类是使高维空间的点与平面上的某种图形对应。这种图点与平面上的某种图形对应。这种图形能反映高维数据的某些特点或数据形能反映高维数据的某些特点或数据间的某些关系。间的某些关系。(本章介绍本章介绍)另一类是对多变量数据进行降维处理。另一类是对多变量数据进行降维处理。在尽可能多地保留原始信息的原则下,在尽可能多地保留原始信息的原则下,将数据的维数降为将数据的维数降为2 2维或维或1 1维,然后再维,然后再在平面上表示。在平面上表示。(主成分分析、因子分析方法等主成分分析、因子分析方法等)“图形的最大价值就是使我们注意到图形的最大价值就是使我们注意到我们从
2、来没有料到过的信息。我们从来没有料到过的信息。”-约翰约翰 图克图克(John(John TukeyTukey)多变量(多维数据)的图示方法,称多变量(多维数据)的图示方法,称为为多变量的可视化多变量的可视化 简介什么是多变量的可视化?第2章 多变量的可视化 2.1轮廓图 2.2雷达图 2.3调和曲线图 2.4散点图 2.5脸谱图 2.6星座图 2.7小贴士下面的数据,你怎么想?下面的数据,你怎么想?钢铁工业是国家经钢铁工业是国家经济水平和综合国力济水平和综合国力的重要标志。的重要标志。为了比较国内钢铁为了比较国内钢铁公司与韩国浦项钢公司与韩国浦项钢铁公司的差距铁公司的差距.某年度的五大钢铁某
3、年度的五大钢铁公司反映经营状况公司反映经营状况的的1010个指标数据。个指标数据。指标指标宝钢宝钢鞍钢鞍钢武钢武钢首钢首钢浦项浦项负债保障率2.892.952.341.853.12长期负债倍数5.169.156.072.636.96流动比率1.311.831.162.222.1资产利润率21.7117.3424.7711.8925.34收入利润率23.1711.3319.557.622.28成本费用利润率30.2312.7624.818.0528.52净利润现金比率1.790.91.71.091.3三年资产平均增长率1.487.2863.311.7613.18三年销售平均增长率20.0729.
4、1952.8818.7724.16三年平均资本增长率11.0410.548.957.6317.512.1轮廓图 轮廓图是将多元数据以折线轮廓图是将多元数据以折线的方式表示在平面中的图。的方式表示在平面中的图。作图步骤为:作图步骤为:(1 1)坐标系,横坐标取)坐标系,横坐标取p p个个点,表示点,表示p p个变量,纵坐标个变量,纵坐标表示变量取值。表示变量取值。(2 2)将表示)将表示p p个变量取值的个变量取值的点(个高度的顶点)连接点(个高度的顶点)连接成一条折线。成一条折线。n n次观测可绘出次观测可绘出n n条折线,构条折线,构成多变量轮廓图。成多变量轮廓图。轮廓图轮廓图变形变形 学者
5、(杜子芳)将折线图旋转学者(杜子芳)将折线图旋转9090度,得到形如闪电的闪电图。度,得到形如闪电的闪电图。例如关于地铁公交服务优劣比较的闪电图(下图)。例如关于地铁公交服务优劣比较的闪电图(下图)。为了便于显示轮廓间的差异,把折线纵向展开而非横向展开。为了便于显示轮廓间的差异,把折线纵向展开而非横向展开。通常纸张是纵长横短的长方形,闪电图所容纳指标可以更多。通常纸张是纵长横短的长方形,闪电图所容纳指标可以更多。2.2雷达图 图形像雷达荧光屏上的图像,称为雷达图(蛛网图、蜘蛛图)图形像雷达荧光屏上的图像,称为雷达图(蛛网图、蜘蛛图)作图步骤为:作图步骤为:(1 1)作一圆,并按变量的个数)作一
6、圆,并按变量的个数p p,将圆周分为,将圆周分为p p等分。等分。(2 2)连接圆心和各分点,将这)连接圆心和各分点,将这p p条半径连线依次定义为各变量的坐条半径连线依次定义为各变量的坐标轴,并标以适当的刻度。标轴,并标以适当的刻度。(3 3)对给定的一次观测值,将个变量值分别标点在相应的坐标)对给定的一次观测值,将个变量值分别标点在相应的坐标轴上,把轴上,把p p个点相连,形成了一个个点相连,形成了一个p p边形。边形。n n次观测值就可画出次观测值就可画出n n个个p p边形。边形。2.3调和曲线图 调和曲线图是调和曲线图是AndrewsAndrews(19721972)提出的三角多项式
7、作图法。)提出的三角多项式作图法。思想是把多维空间中的一个点对应于二维平面上的一条曲线。思想是把多维空间中的一个点对应于二维平面上的一条曲线。1212345(,)()sincossin2cos22(,)pxpXx xxxf txtxtxtxttt 设 维数据对应的调和曲线函数是上式当 在区间上变化时,其轨迹是一条曲线。2.4散点图 散点图是以点的分布反映变量之间相关关系的可视化方法。散点图是以点的分布反映变量之间相关关系的可视化方法。作图步骤为:作图步骤为:以两个变量为例,把两个变量以两个变量为例,把两个变量X与与Y的每对观测数据的每对观测数据(x,y),看成平面上点的横纵坐标,依次描点,可得
展开阅读全文