《应用多元统计分析》课件yydyfx4.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《《应用多元统计分析》课件yydyfx4.ppt》由用户(momomo)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用多元统计分析 应用 多元 统计分析 课件 yydyfx4
- 资源描述:
-
1、1应用多元统计分析应用多元统计分析第四章第四章 回归分回归分析析2第四章第四章 回归分析目录4.1 经典多元线性回归经典多元线性回归4.2 回归变量的选择与逐步回归回归变量的选择与逐步回归4.3 多因变量的多元线性回归多因变量的多元线性回归4.4 多因变量的逐步回归多因变量的逐步回归4.5 双重筛选逐步回归双重筛选逐步回归3第四章第四章 回归分析 回归分析是处理多个变量间相关关系回归分析是处理多个变量间相关关系的一种数学方法的一种数学方法.变量间的关系有两种类型变量间的关系有两种类型:确定性的函确定性的函数关系和相关关系数关系和相关关系.回归分析方法是处理回归分析方法是处理变量间相关关系的有力
2、工具变量间相关关系的有力工具.回归分析用于确定一个或几个连续变回归分析用于确定一个或几个连续变量量(称为响应变量、因变量或指标称为响应变量、因变量或指标)与另一些与另一些连续变量连续变量(称为自变量或因素称为自变量或因素)间的相互依赖间的相互依赖关系关系.4第四章第四章 回归分析 如果只要考察某一个因变量与如果只要考察某一个因变量与其余多个变量的相互依赖关系其余多个变量的相互依赖关系.我我们称为多元回归问题们称为多元回归问题.如果要同时考察如果要同时考察p个因变量与个因变量与m个自变量的相互依赖关系个自变量的相互依赖关系,我们称我们称为多因变量的多元回归问题(或简为多因变量的多元回归问题(或简
3、称为多对多回归)称为多对多回归).5第四章第四章 回归分析具体地说具体地说,我们研究以下几方面问题:我们研究以下几方面问题:建立因变量建立因变量Y(或或Y1,Yp)与与x1,x2,xm的经的经验公式验公式(回归方程回归方程);对经验公式的可信度进行检验;对经验公式的可信度进行检验;判断每个自变量判断每个自变量xi(i=1,m)对对Y(或或Y1,Yp)的影响是否显著的影响是否显著?利用经验公式利用经验公式(回归关系式回归关系式)进行预报和控进行预报和控制制,并用于指导生产;并用于指导生产;诊断经验公式是否适合这组数据。诊断经验公式是否适合这组数据。6第四章第四章 回归分析 在一元统计分析中讨论的
4、多元线性回归是只在一元统计分析中讨论的多元线性回归是只考虑一个因变量的回归问题考虑一个因变量的回归问题.多元统计分析中讨论的回归问题是指有多个多元统计分析中讨论的回归问题是指有多个因变量的回归问题因变量的回归问题,它自然把一元统计中的回归它自然把一元统计中的回归作为特例作为特例.因多元线性回归问题在实际应用中更因多元线性回归问题在实际应用中更为广泛为广泛,它涉及的统计推断结论能够推广到多因它涉及的统计推断结论能够推广到多因变量的多元线性回归的问题中变量的多元线性回归的问题中.本章首先不加证明地介绍经典多元线性回归本章首先不加证明地介绍经典多元线性回归、逐步回归的一些结论,然后简单介绍多因变、逐
5、步回归的一些结论,然后简单介绍多因变量的多元线性回归和双重筛选逐步回归量的多元线性回归和双重筛选逐步回归.7第四章第四章 4.1 4.1 经典多元线性回归经典多元线性回归 多元线性回归模型多元线性回归模型 多元回归分析是研究因变量多元回归分析是研究因变量Y与与m个自变量个自变量x1,x2,.,xm的相关关系的相关关系.而且总是假设因变量而且总是假设因变量Y是随机变量是随机变量,而而x1,x2,.,xm 为一般变量为一般变量.假定因变量假定因变量Y与与x1,x2,.,xm 线性相关线性相关.收集到的收集到的n组组数据数据(yt,xt1,xt2,.,xtm )(t=1,2,n)满足以下回归模型:满
6、足以下回归模型:(4.1.1)8第四章第四章 4.1 4.1 经典多元线性回归经典多元线性回归 多元线性回归模型多元线性回归模型 记记 9第四章第四章 4.1 4.1 经典多元线性回归经典多元线性回归 多元线性回归模型多元线性回归模型 则则(4.1.1)的矩阵形式为的矩阵形式为 Y=C+,E()=0,D()=2In,或或 Y=C+,Nn(0,2In),(4.1.2)(4.1.3)并称模型并称模型(4.1.2)或或(4.1.3)为经典多元线性回归模为经典多元线性回归模型型.其中其中Y是可观测的随机向量是可观测的随机向量,是不可观测的是不可观测的随机向量随机向量,C是已知矩阵是已知矩阵,2是未知参
7、数是未知参数.并设并设nm,且且rk(C)=m+1.10第四章第四章 4.1 4.1 经典多元线性回归经典多元线性回归 多元线性回归模型多元线性回归模型 在经典回归分析中在经典回归分析中,我们讨论多元线我们讨论多元线性回归模型中未知的参数向量性回归模型中未知的参数向量=(0,1,m)和和2的估计和检验问题的估计和检验问题.在近代回归分析中讨论变量筛选、在近代回归分析中讨论变量筛选、估计的改进及对模型中的一些假定进估计的改进及对模型中的一些假定进行诊断行诊断.11第四章第四章 4.1 4.1 经典多元线性回归经典多元线性回归 参数向量参数向量的最小二乘估计的最小二乘估计 定义定义4.1.1 在模
8、型在模型(4.1.2)中,参数中,参数的最小的最小二乘估计量二乘估计量b=(b0,b1,bm)是使误差平方和是使误差平方和Q(b)达最小达最小.即即其中其中 12第四章第四章 4.1 4.1 经典多元线性回归经典多元线性回归 参数向量参数向量的最小二乘估计的最小二乘估计 ,111)()2()1(1221111nnmnmmcccxxxxxxC记记,)()2()1(ncccC则则)()(),()()()()1(1)()1(112)(12110CYCYcycycycycyxxyQnnnnntttnttmmtt13第四章第四章 4.1 4.1 经典多元线性回归经典多元线性回归参数向量参数向量的最小二乘
9、估计的最小二乘估计 定理定理4.1.1 设设rk(C)=m+1n,则则 b=(CC)-1CY=BY 是是的最小二乘估计的最小二乘估计(其中其中B=(CC)-1C).参数向量参数向量的最小二乘估计的最小二乘估计=b正好是正好是m+1阶阶的线性方程组的线性方程组 CC=CY的解的解.常称以上方程组为常称以上方程组为正规方程正规方程.预测向量为预测向量为 Y=C b=HY,其中其中H=C(CC)-1C称为称为“帽子帽子”矩阵矩阵。14第四章第四章 4.1 4.1 经典多元线性回归经典多元线性回归 参数向量参数向量的最小二乘估计的统计性质的最小二乘估计的统计性质 的最小二乘估计量的最小二乘估计量b有以
10、下性质:有以下性质:(1)b是是的极小方差线性无偏估计的极小方差线性无偏估计.(2)bNm+1(,2(CC)-1).因因b=BY,Y Nn(C,2In),故故b服从正态分布服从正态分布,且且 E(b)=BC=(CC)-1CC=,D(b)=B2InB=2(CC)1.(3)在在Nn(0,2 In)的假定下的假定下,b还是一切还是一切无偏估计中方差最小的估计无偏估计中方差最小的估计.15第四章第四章 4.1 4.1 经典多元线性回归经典多元线性回归 2的估计的估计 最小二乘法没有给出最小二乘法没有给出2的估计的估计.利用最大似然利用最大似然原则可得原则可得的最大似然估计量仍为的最大似然估计量仍为b,
11、同时给出了同时给出了2 的最大似然估计为的最大似然估计为但因但因2不是不是2 的无偏估计量的无偏估计量.通常取通常取s 2作为作为2的估计的估计:16第四章第四章 4.1 4.1 经典多元线性回归经典多元线性回归 2的估计的估计)()()()()()()(1是对称幂等阵因HIPPYYYHIYYHIYCCCCYCbYCbYbQnnn(定理定理4.1.24.1.2的证明的证明)0,()()()(PCCYPCCYPCCYPYYbQ)1()(tr)(tr)(Etr)(tr(E)(tr(E)(E)(E222mnPIPPPPPbQn17第四章第四章 4.1 4.1 经典多元线性回归经典多元线性回归 回归方
12、程的显著性检验回归方程的显著性检验 在实际问题中在实际问题中,我们事先并不能判定因变量我们事先并不能判定因变量Y与变量与变量x1,x2,xm 之间确有线性关系之间确有线性关系.在求出在求出回归系数回归系数的估计之前的估计之前,回归模型回归模型(4.1.2)只是一种只是一种假定假定,尽管这种假定常常不是没有根据的尽管这种假定常常不是没有根据的,但在但在求出线性回归方程后求出线性回归方程后,还需对还需对Y与与x1,x2,.,xm 有有否线性关系进行统计检验否线性关系进行统计检验,以给出肯定或者否定以给出肯定或者否定的结论的结论.我们假定我们假定E(Y)=0+1 x1+mxm,如果如果Y与与x1,x
13、2,.,xm之间均无线性相关关系之间均无线性相关关系,则以上模型中则以上模型中xi(i=1,2,m)的系数的系数i 应均为应均为0.18第四章第四章 4.1 4.1 经典多元线性回归经典多元线性回归 回归方程的显著性检验回归方程的显著性检验 首先应检验以下假设:首先应检验以下假设:H0:1=2=.=m=0使用的方法仍是方差分析法。从分析引起使用的方法仍是方差分析法。从分析引起yt(t=1,n)变化的总变差变化的总变差Total SS的原因入手。显然使得的原因入手。显然使得Y变化的变化的原因有二个:原因有二个:第一第一,因因Y与与xi(i=1,m)线性相关,由线性相关,由xi的变化引起的变化引起
14、Y的变化的变化(Model SS);第二,其它因素或误差引起的第二,其它因素或误差引起的(Error SS)。若。若Y的变的变化主要是由化主要是由xi的变化引起的,则模型中的自变量的变化引起的,则模型中的自变量xi的系的系数数i0。用方差分析的思想用方差分析的思想,把把yt(t=1,n)的总变差进行分解:的总变差进行分解:Total SS=Model SS+Error SS19第四章第四章 4.1 4.1 经典多元线性回归经典多元线性回归 回归方程的显著性检验回归方程的显著性检验-平方和分解公式平方和分解公式 niiniiiniiyyyyyy121212)()()(引理引理4.1.1 对任给定
15、的观测数据阵对任给定的观测数据阵 恒有公式恒有公式:其中其中).,1(11101nixxyynyimmiinii(4.1.4)20第四章第四章 4.1 4.1 经典多元线性回归经典多元线性回归 回归方程的显著性检验回归方程的显著性检验-平方和分解公式平方和分解公式 而而=(CC)-1CY是是的最小二乘估计的最小二乘估计.公式公式(4.1.4)称为平方和分解公式称为平方和分解公式.平方和分解公式平方和分解公式(4.1.4)的左边的左边(yi-y)2体现了体现了Y的观测值的观测值y1,y2,.,yn 总波动大小,称为总偏差总波动大小,称为总偏差平方和平方和,记作记作lyy(或或TSS).(4.1.
16、4)式右边的第二项式右边的第二项(yi-y)2体现了体现了n个估计值个估计值 y1,y2,.,yn的波动大小的波动大小;它是由于它是由于Y与变量与变量x1,x2,.,xm 之间确有线性关之间确有线性关系而通过系而通过x1,x2,.,xm 的变化而引起的变化而引起,我们称它为我们称它为回归平方和或模型平方和回归平方和或模型平方和,记为记为U(或或MSS)21第四章第四章 4.1 4.1 经典多元线性回归经典多元线性回归 回归方程的显著性检验回归方程的显著性检验-平方和分解公式平方和分解公式 (4.1.4)式右边第一项式右边第一项(yi-yi)2=2称为残差平方和称为残差平方和,记记为为Q(或或E
17、SS).在模型在模型(4.1.2)假定下假定下,即即E(Y)=0+1 x1+mxm,Q是由于随机误差引起的是由于随机误差引起的.实际上模型实际上模型(4.1.2)只是一种假只是一种假定定,变量变量x1,x2,.,xm和和Y的关系除了线性关系外的关系除了线性关系外,可能还可能还有非线性的关系有非线性的关系.Q是除了是除了x1,x2,.,xm对对Y的线性关系之的线性关系之外的一切其它因素外的一切其它因素(包括包括x1,x2,.,xm对对Y的非线性关系的非线性关系及随机误差及随机误差)引起的引起的.故故Q也称为剩余平方和或误差平方也称为剩余平方和或误差平方和和.利用以上记号利用以上记号(4.1.4)
18、式可简写为式可简写为:lyy=Q+U,或或 TSS=ESS+MSS,(4.1.5)22第四章第四章 4.1 4.1 经典多元线性回归经典多元线性回归回归方程的显著性检验回归方程的显著性检验-平方和分解公式平方和分解公式 Error SS=ESS=Y(I-C(C C)-1C )Y=Error SS/(n-m-1)R2=Model SS/Total SS =U/lyy 称为决定系数;称为决定系数;而而R称为复相关系数。称为复相关系数。23第四章第四章 4.1 4.1 经典多元线性回归经典多元线性回归 回归方程的显著性检验回归方程的显著性检验定理定理4.1.3 4.1.3 定理定理4.1.3 在模型
19、在模型(4.1.3)下有下有 24第四章第四章 4.1 4.1 经典多元线性回归经典多元线性回归 回归方程的显著性检验回归方程的显著性检验-定理定理4.1.3 4.1.3 ).1(1:.1)(tr,),0(,)(222mnQmnPPINPbQQnn知由第三章第一节的结论且是对称幂等阵而 定理的结论定理的结论(1)前面已经证明前面已经证明.(2)因因25第四章第四章 4.1 4.1 经典多元线性回归经典多元线性回归 回归方程的显著性检验回归方程的显著性检验-定理定理4.1.3 4.1.3 (3)因因 Q=P,.)()()()()(111相互独立与故因且QOHICPCOBPCCCBBCCCCYCC
20、Cbn(4)YPDYPYYYnIYPYYYYYYQlUnnnnnyy)()111()1()1(因26第四章第四章 4.1 4.1 经典多元线性回归经典多元线性回归 回归方程的显著性检验回归方程的显著性检验-定理定理4.1.3 4.1.3 ),()(14).,1(,1)1(,.)1()1()(tr,2220000mYPDYINYOXCHmmnnPDPDnnnnn知由第三章第一节的结论所以下在且是对称幂等阵可以验证27第四章第四章 4.1 4.1 经典多元线性回归经典多元线性回归 回归方程的显著性检验回归方程的显著性检验-定理定理4.1.3 4.1.3 非中心参数非中心参数 为为0)11()1(1
21、1)()1(1002002nnnnnPDPD).()(1222mYPDYU所以28第四章第四章 4.1 4.1 经典多元线性回归经典多元线性回归 回归方程的显著性检验回归方程的显著性检验 为检验为检验H0,由总变差的分解公式:由总变差的分解公式:Total SS=MSS+ESS可构造检验假设的检验统计量可构造检验假设的检验统计量F F=MSS/fm MMS(模型均方)模型均方)ESS/fe MSE(均方误差)(均方误差)在在H0成立时成立时,检验统计量检验统计量FF(m,n-m-1),其中其中fm=m和和fe=n-m-1分别称为模型的自由度和误差的自由度分别称为模型的自由度和误差的自由度.29
22、第四章第四章 4.1 4.1 经典多元线性回归经典多元线性回归 回归方程的显著性检验回归方程的显著性检验 由观测数据计算由观测数据计算F F 值及显著性概率值及显著性概率(p p值值),p p值是指在值是指在H H0 0下,利用下,利用F F 的分布规的分布规律,计算出检验统计量律,计算出检验统计量F F大于或等于样本大于或等于样本F F 值(即比该组样本得到的值(即比该组样本得到的F F 值更极端值更极端的事件)的概率。若得出的的事件)的概率。若得出的p p值很小值很小(小小于显著性水平于显著性水平),依统计思想,小概率,依统计思想,小概率事件在一次实践中一般不会发生。如果事件在一次实践中一
23、般不会发生。如果发生小概率事件,将否定前提假定发生小概率事件,将否定前提假定H H0 0.30第四章第四章 4.1 4.1 经典多元线性回归经典多元线性回归 正规方程的等价形式及正规方程的等价形式及U U的计算公式的计算公式 回归模型回归模型(4.1.1)可以改写为可以改写为(4.1.7)它与原模型它与原模型(4.1.1)没有本质差别,只不过是没有本质差别,只不过是 模型模型(4.1.7)的特点是对观测数据的特点是对观测数据(yt,xt1,xt2,.,xtm )(t=1,2,n)做了中心化处理做了中心化处理.下面将说明在下面将说明在(4.1.7)下得下得到的正规方程的形式到的正规方程的形式.3
24、1第四章第四章 4.1 4.1 经典多元线性回归经典多元线性回归 正规方程的等价形式及正规方程的等价形式及U U的计算公式的计算公式记记 32第四章第四章 4.1 4.1 经典多元线性回归经典多元线性回归 正规方程的等价形式及正规方程的等价形式及U U的计算公式的计算公式则则(4.1.7)的矩阵形式为的矩阵形式为 正规方程为:正规方程为:又又 其中其中.YCCC33第四章第四章 4.1 4.1 经典多元线性回归经典多元线性回归 正规方程的等价形式及正规方程的等价形式及U U的计算公式的计算公式而而 其中其中 于是正规方程可写为:于是正规方程可写为:(修改修改P112).),2,1,()(1mj
25、ixxxxlnkjkjikiij34第四章第四章 4.1 4.1 经典多元线性回归经典多元线性回归 正规方程的等价形式及正规方程的等价形式及U U的计算公式的计算公式 由此可得出由此可得出*0=0,故正规方程的另一等价形故正规方程的另一等价形式为式为 LB=l,(4.1.8)其中其中(4.1.8)是是m阶线性方程组阶线性方程组,解解(4.1.8)得得B的的最小二乘估计为:最小二乘估计为:35第四章第四章 4.1 4.1 经典多元线性回归经典多元线性回归 正规方程的等价形式及正规方程的等价形式及U U的计算公式的计算公式数据中心化后的线性回归模型数据中心化后的线性回归模型(4.1.7)可表为可表
展开阅读全文