统计方法建模课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《统计方法建模课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 方法 建模 课件
- 资源描述:
-
1、 统计方法建模 1 1 相关分析相关分析 2 2 多元回归多元回归 3 3 曲线回归曲线回归 4 4 主成份分析主成份分析 5 5 判别分析判别分析 6 6 聚类分析聚类分析 7 7 模糊聚类分析模糊聚类分析 8 8 偏最小二乘回归分析偏最小二乘回归分析第一节第一节 相关分析相关分析一、相关关系的概念一、相关关系的概念( (注意相关关系与函数关系的区别注意相关关系与函数关系的区别) ) ( (一一) ) 函数关系函数关系 它它反映着现象之间存在反映着现象之间存在着严格的依存关系,也就着严格的依存关系,也就是具有确定性的对应关系,是具有确定性的对应关系,这种关系可用一个数学表这种关系可用一个数学
2、表达式反映出来。达式反映出来。 若两个现象若两个现象x x、y y有严格有严格的直线依存关系,则其函的直线依存关系,则其函数关系还可用右图表示。数关系还可用右图表示。321xxxy2x2Rsxpy3x1x( (二二) ) 相关关系相关关系 它它反映着现象之间的数量上不严格的依存关系,也就反映着现象之间的数量上不严格的依存关系,也就是说两者之间不具有确定性的对应关系,这种关系有二个是说两者之间不具有确定性的对应关系,这种关系有二个明显特点:明显特点:1.1.现现象之间确实存在数量象之间确实存在数量上的依存关系,即某一社会上的依存关系,即某一社会经济现象变化要引起另一社经济现象变化要引起另一社会经
3、济现象的变化;会经济现象的变化;2.2.现现象之间的这种依存关系象之间的这种依存关系是不严格的,即无法用数学是不严格的,即无法用数学公式准确表示。公式准确表示。 若现象间的这种不严格的依若现象间的这种不严格的依存关系近似于一种直线关系,存关系近似于一种直线关系,则其相关关系的图示如右。则其相关关系的图示如右。商品的消费量商品的消费量(y)(y)与居民收入与居民收入(x)(x)之间的关系之间的关系商品销售额商品销售额(y)(y)与广告费支出与广告费支出(x)(x)之间的关系之间的关系粮食亩产量粮食亩产量(y)(y)与施肥量与施肥量(x1) (x1) 、降雨量、降雨量(x2) (x2) 、温度温度
4、(x3)(x3)之间的关系之间的关系收入水平收入水平(y)(y)与受教育程度与受教育程度(x)(x)之间的关系之间的关系父亲身高父亲身高(y)(y)与子女身高与子女身高(x)(x)之间的关系之间的关系商品消费量与居民收入之间,当居民收商品消费量与居民收入之间,当居民收入发生变动,商品消费量也会随之发生变动。入发生变动,商品消费量也会随之发生变动。所以,居民收入为自变量所以,居民收入为自变量X X,而商品消费量为,而商品消费量为因变量因变量Y Y。 在在具有相互依存关系的两个变量中,作为具有相互依存关系的两个变量中,作为根据的变量称自变量,一般用根据的变量称自变量,一般用X X表示;发生对表示;
5、发生对应变化的变量称因变量,一般用应变化的变量称因变量,一般用y y表示。表示。如如一般地一般地商品价格和商品销售量?(请同学分析)商品价格和商品销售量?(请同学分析)又如又如1.1.按按相关关系涉及的因素多少来分,可分为:相关关系涉及的因素多少来分,可分为: 单相关和复相关。单相关和复相关。 在实际工作中,如存在多个自变量,可抓住在实际工作中,如存在多个自变量,可抓住其中主要的自变量,研究其相关关系,而保持另其中主要的自变量,研究其相关关系,而保持另一些因素不变,这时复相关可转化为一些因素不变,这时复相关可转化为偏相关偏相关。二因素之间的相关关系称二因素之间的相关关系称单相关单相关,即只涉,
6、即只涉及一个自变量和一个因变量。及一个自变量和一个因变量。三个或三个以上因素的相关关系称三个或三个以上因素的相关关系称复相关复相关,或多元相关,即涉及二个或二个以上的自变量和或多元相关,即涉及二个或二个以上的自变量和因变量。因变量。二、相关关系的种类二、相关关系的种类 2.2.按按相关关系的性质来分,可分为相关关系的性质来分,可分为: : 正相关和负相关正相关和负相关正相关正相关是指两相关现象变化的方向是一致的。是指两相关现象变化的方向是一致的。负相关负相关是指两相关现象变化的方向是相反的。是指两相关现象变化的方向是相反的。正相关负相关3. 3. 按按相关关系的形式来分,可分为:相关关系的形式
7、来分,可分为: 直线相关和曲线相关直线相关和曲线相关 直线相关直线相关是指两个相关现象之间,当自变量是指两个相关现象之间,当自变量X X的数值发生变动时,因变量的数值发生变动时,因变量y y随之发生近似于固定比随之发生近似于固定比例的变动,在相关图上的散点近似地表现为直线形式,例的变动,在相关图上的散点近似地表现为直线形式,因此称其为直线相关关系。因此称其为直线相关关系。 曲线相关曲线相关是指两个相关现象之间,当自变量是指两个相关现象之间,当自变量X X的数值发生变动时,因变量的数值发生变动时,因变量y y也随之发生变动,但这也随之发生变动,但这种变动在数值上不成固定比例,在相关图上的散点可种
8、变动在数值上不成固定比例,在相关图上的散点可表现为抛物线、指数曲线、双曲线等形式,因此称其表现为抛物线、指数曲线、双曲线等形式,因此称其为曲线相关关系。为曲线相关关系。曲线相关直线相关4.4. 按按相关程度分,可分为:相关程度分,可分为: 完全相关、不完全相关和不相关完全相关、不完全相关和不相关 完全相关完全相关就是相关现象之间的关系是完全确定就是相关现象之间的关系是完全确定的关系,因而完全相关关系就是函数关系。的关系,因而完全相关关系就是函数关系。 不相关不相关是指两现象之间在数量上的变化上各自是指两现象之间在数量上的变化上各自独立,互不影响。独立,互不影响。 不完全相关不完全相关就是介于完
9、全相关和不相关之间的就是介于完全相关和不相关之间的一种相关关系。相关分析的对象主要是不完全相关一种相关关系。相关分析的对象主要是不完全相关关系。关系。三、相关分析的任务和内容三、相关分析的任务和内容 (一)相关分析的主要任务,概括起来是两个方面:(一)相关分析的主要任务,概括起来是两个方面:一方面一方面,研究现象之间关系的密切程度,即相关,研究现象之间关系的密切程度,即相关分析,这也称狭义的相关分析。分析,这也称狭义的相关分析。另一方面另一方面,研究自变量与因变量之间的变动关,研究自变量与因变量之间的变动关系,用一个合适的数学模型近似地表达其相关关系,系,用一个合适的数学模型近似地表达其相关关
10、系,即回归分析。即回归分析。显然显然,相关分析与回归分析既有区别,也有联系。,相关分析与回归分析既有区别,也有联系。相关分析与回归分析的区别 1.在相关分析中在相关分析中,不必确定自变量和因变量;,不必确定自变量和因变量;而在而在回归分析中回归分析中,必须事先确定哪个为自变,必须事先确定哪个为自变量,哪个为因变量,而且只能从自变量去推量,哪个为因变量,而且只能从自变量去推测因变量,而不能从因变量去推断自变量。测因变量,而不能从因变量去推断自变量。2.2.相关分析相关分析不能指出变量间相互关系的具体形不能指出变量间相互关系的具体形式;而式;而回归分析回归分析能确切的指出变量之间相互能确切的指出变
11、量之间相互关系的具体形式,它可根据回归模型从已知关系的具体形式,它可根据回归模型从已知量估计和预测未知量。量估计和预测未知量。3.3.相关分析相关分析所涉及的变量一般都是随机变量,所涉及的变量一般都是随机变量,而而回归分析回归分析中因变量是随机的,自变量则作中因变量是随机的,自变量则作为研究时给定的非随机变量。为研究时给定的非随机变量。相关分析与回归分析的联系 相关分析和回归分析有着密切的联系,它们不仅具相关分析和回归分析有着密切的联系,它们不仅具有共同的研究对象,而且在具体应用时,常常必须有共同的研究对象,而且在具体应用时,常常必须互相补充。互相补充。 相关分析需要依靠回归分析来表明现象数量
12、相关的相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度。现象数量变化的相关程度。 只有当变量之间存在着高度相关时,进行回归分析只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。寻求其相关的具体形式才有意义。相关分析是回归分析的基础和前提,回归分析是相关分析相关分析是回归分析的基础和前提,回归分析是相关分析的深入和继续。的深入和继续。(二)相关分析的主要内容包括以下五个(二)相关分析的主要内容包括以下五个方面:方面:1. 1. 判判断社会经济现象之间是否存在相互依存断
13、社会经济现象之间是否存在相互依存的关系,是直线相关,还是曲线相关,这的关系,是直线相关,还是曲线相关,这是相关分析的出发点;是相关分析的出发点;2. 2. 确确定相关关系的密切程度;定相关关系的密切程度;3. 3. 测测定两个变量之间的一般关系值;定两个变量之间的一般关系值;4. 4. 测测定因变量估计值和实际值之间的差异,定因变量估计值和实际值之间的差异,用以反映因变量估计值的可靠程度;用以反映因变量估计值的可靠程度;5. 5. 相相关系数的显著性检验。关系数的显著性检验。第二节第二节 简单线性相关分析简单线性相关分析 定性分析定性分析定量分析定量分析一、相关关系的判定一、相关关系的判定(一
14、)相关表(一)相关表 将自变量将自变量x的数值按照从小到大的顺序,并配的数值按照从小到大的顺序,并配合因变量合因变量y的数值一一对应而平行排列的表。的数值一一对应而平行排列的表。二、相关表和相关图二、相关表和相关图简单相关表简单相关表分组相关表分组相关表单变量分组相关表单变量分组相关表双变量分组相关表双变量分组相关表 又称散点图。将又称散点图。将x置于横轴上,置于横轴上,y置于纵置于纵轴上,将(轴上,将(x,y)绘于坐标图上。绘于坐标图上。用来反映两用来反映两变量之间相关关系的图形。变量之间相关关系的图形。 当有三个变量存在相关关系时,如何用当有三个变量存在相关关系时,如何用相关图表示呢?相关
15、图表示呢?(二)相关图(二)相关图 某市某市19961996年年 2003 2003年的工资性现金支出与城镇储蓄存款余额的资年的工资性现金支出与城镇储蓄存款余额的资料,说明简单相关表和相关图的编制方法。料,说明简单相关表和相关图的编制方法。 从表可看出,随着工资性现金支出的增加,城镇储蓄存款余额有明从表可看出,随着工资性现金支出的增加,城镇储蓄存款余额有明显的增长趋势。所以,资料表明显的增长趋势。所以,资料表明( (如图如图) )有明显的直线相关趋势。有明显的直线相关趋势。序号年份工资性现金支出(万元)x城镇储蓄存款余额(万元)y11996 50012021997 54014031998 62
16、015041999 73020052000 90028062001 97035072002 105045082003 117051050100150200250300350400450500550400500600700800900100011001200工资性现金支出( 万元)城镇储蓄存款余额(万元) 例例1 1:简单相关表和相关图:简单相关表和相关图企业按销售额分组(万元)流通费用率(%)4以下9.65 4 87.68 8 127.2512 167.0016 206.8620 246.7324 286.6428 326.6032 366.5866.577.588.599.510048121
17、62024283236销售额(万元)流通费用率(%) 例例2 2 简单分组相关表和相关图简单分组相关表和相关图三、相关系数与应用三、相关系数与应用 相相关系数是在直线相关条件下,表明两关系数是在直线相关条件下,表明两个现象之间相关关系的方向和密切程度的综个现象之间相关关系的方向和密切程度的综合性指标。合性指标。一般用样本数据计算,记为一般用样本数据计算,记为r r;若;若用总体全部数据计算,则称为总体相关系数,用总体全部数据计算,则称为总体相关系数,记为记为 。(一)相关系数定义(一)相关系数定义 (二)相关系数(二)相关系数r r的测定方法:的测定方法:1 1、r r的计算的计算简化后为简化
18、后为: :2 2、对、对r r的解释如下:的解释如下:( (即即r r的特点的特点) )(1) (1) r r取正值或负值决定于分子协方差;取正值或负值决定于分子协方差;(2) (2) r r的绝对值,在的绝对值,在0 0与与1 1之间;之间;(3) (3) r r的绝对值大小,可说明现象之间相关关系的紧的绝对值大小,可说明现象之间相关关系的紧密程度。密程度。r rr rr rr r0.30.3时时,没没有有关关系系;0.30.3 0.50.5时时,称称低低度度相相关关;0.50.5 0.80b0,x x与与y y为正相关为正相关 b0b0,x x与与y y为负相关为负相关 2、a、b的确定:
19、在在简单直线回归方程中,简单直线回归方程中,a a、b b为待定系数,常用为待定系数,常用最小平方法来确定,最小平方法来确定,即即(y-y(y-yc c) )2= =最小值。最小值。2ynabxxyaxbx 即即22()nxyxybnxxyxabnn 3.简单直线回归方程建立的步骤为: 确定自变量确定自变量x x和因变量和因变量y y; 计算计算x x2 2、xyxy、xx、yy、xx2 2、xyxy; 代入公式,先求代入公式,先求b b,再求,再求a a。 写出回归方程写出回归方程4、简单直线回归分析的主要特点:、简单直线回归分析的主要特点: 1.1.直直线回归分析时,要根据研究目的,在两线
20、回归分析时,要根据研究目的,在两个变量之间确定哪个是自变量,哪个是因变量。个变量之间确定哪个是自变量,哪个是因变量。 2.2.在在两个现象互为根据的情况下,可以有两两个现象互为根据的情况下,可以有两个回归方程:个回归方程: y yc c=a+bx=a+bx 称称y y倚倚x x回归直线回归直线 x xc c=c+dy=c+dy 称称x x倚倚y y回归直线回归直线多多元线性回归分析可以看作是一元线元线性回归分析可以看作是一元线性回归分析的扩展。性回归分析的扩展。一、数学模型设可控或不可控的自变量设可控或不可控的自变量 ;目标函目标函数数 ,已测得的,已测得的n组数据为:组数据为: (1.1)其
21、中其中 是系统的测试数据,相当是系统的测试数据,相当于如下模型:设多目标系统为于如下模型:设多目标系统为: xxxp12,yyym12,2121mpyyyxxxyjmnj, , , ,1212 系统x1x2xpy1y2ym为简化问题,不妨设该系统为单目标系统,且由函数关为简化问题,不妨设该系统为单目标系统,且由函数关系系 ,可以设:,可以设: (1.2) 可得如下线性模型可得如下线性模型 (1.3) 为测量误差,相互独立,为测量误差,相互独立, 。 令令yf xxxp(,)12yxxpp011nnppnnnppppxxxyxxxyxxxy22110222222211021112211101 1
22、2,niN( , )0YyyyXxxxxxxxxxnppnnnppn121112121222120112111可得可得 (1.4) (1.4) 称为线性回归方程的数学模型。称为线性回归方程的数学模型。 利用最小二乘估计或极大似然估计,令利用最小二乘估计或极大似然估计,令 使使 由方程组由方程组 (1.5) 可得系数可得系数 的估计。的估计。令令 阶方阵可逆,由模型可得:阶方阵可逆,由模型可得: 即有即有 (1.6) 可以证明可以证明(1.6)与与(1.5)是同解方程组的解,它是最优线性无是同解方程组的解,它是最优线性无偏估计量,满足很多良好的性质偏估计量,满足很多良好的性质。YXniippii
23、xxyQ12110QQminpiQi,2, 1 ,0001,pAX XpT设() 1X YX XATTAXYT1二、模型的分析与检验 设目标函数设目标函数 的平均值和估计值分别为:的平均值和估计值分别为: 则由公式可计算得总偏差平方和,回归和剩余平方和:则由公式可计算得总偏差平方和,回归和剩余平方和: yyn1,ynyyyn112()SyySyySyynnn总剩回()( )( )212121SxpSxnpFSpSnpF p np回剩回剩2222111( )()/( ,)Xy 假设检验:假设检验: 至少有一个不为零至少有一个不为零结论是:当结论是:当 当当 被拒绝以后,说明方程被拒绝以后,说明方
24、程(2)中系数不全为零,方程中系数不全为零,方程配得合理。否则在被接受以后,说明方程配得不合适,配得合理。否则在被接受以后,说明方程配得不合适,即变量即变量 对目标函数都没有影响,对目标函数都没有影响,则要从另外因素去考虑该系统。则要从另外因素去考虑该系统。Hp0120:H1:FFp npH( ,),10时 拒绝当时,接受FFp npH( ,) 10H0 xxxp12,三、回归方程系数的显著性检验 假设假设 备选假设备选假设 可以证得:可以证得: (1.8) 或者或者 的对角线元素。的对角线元素。Hjj00:Hjj10:jp 1 2,jjjjjjjjjcNFcSnpFnp剩( , ),() /
25、( ,)0 11112tSnpt npcAXXjjjjjT/()()剩是1111. 在在 成立的条件下成立的条件下 或者或者 查查F检验临界值检验临界值 或或t检验临界值检验临界值 当当 时,时, 显著不为零,方程显著不为零,方程(1.2)中中 第第 j个变量作用显著。若有某一个变量作用显著。若有某一个系数个系数 假设假设 被接受,则应从方程中剔除第被接受,则应从方程中剔除第 j个变个变量。然后从头开始进行一次回归分析工作。量。然后从头开始进行一次回归分析工作。jH0FFnpttnpjj( ,)()1112或ji 012pnSCFjjjj剩1pnSCtjjjj回1pnF12pntjH0四、回归
展开阅读全文