《逐步回归分析》幻灯片PPT.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《《逐步回归分析》幻灯片PPT.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 逐步回归分析 逐步回归 分析 幻灯片 PPT
- 资源描述:
-
1、逐步回归分析幻灯片PPT 多元逐步回归方法的根本思路:自动地从大量的可供选择的变量中选取最重要的变量,据以建立回归分析的预测或者解释模型。变量选取的根据是自变量对因变量作用程度的大小:保存作用程度大的变量,剔除作用小的变量。是否选取一个变量,定量判据之一就是相关系数。假定有m 个自变量,1 个因变量用y 表示,那么全部变量包括自变量和因变量之间的相关系数矩阵可以表作6.1 根本原理根本原理根据相关系数定义一个自变量的“奉献系数按照奉献系数的大小决定一个自变量的去留。式中Pj表示第j 个自变量对因变量的奉献系数,Rjy 表示第j 个自变量与因变量的相关系数,Rjj 表示相关系数矩阵对角线上第j
2、行第j 列元素(j=1,2,m)。第l 步计算的奉献系数表示为 在逐步回归分析过程中,我们不仅要引入奉献最大的自变量,同时要考虑剔除奉献最小的因变量。因此,变量的存留与否又涉及到另一个统计判据F 检验。设定一个显著性水平,查F 检验表,找到F 检验的临界值F。在第l步计算中,假设第v个自变量的奉献系数最大,数值为根据F 检验来判断该自变量是否应该被引入模型。式中h 为尚且没有被引入模型的变量序号,v 为选出的变量对应的原始变量序号v=1,2,m。计算变量引入的F 值判断公式如下式中n 为样品个数,l 为计算步骤数,为第v 个变量第l 步的奉献系数,Ryy 为因变量的自相关系数。如果FinF,那
3、么在这个显著性水平下,该变量可以被引入模型,否那么不要引入。在第l 步计算中,如果第v 个自变量的奉献系数为那么可以根据F 检验来判断该自变量包括已经引入的变量是否应该被剔除。计算变量剔除的F 值判断公式如下 如果Fout F,那么在这个显著性水平下,该变量应该被剔除,否那么就要保存。在整个逐步回归计算过程中,变量的引入和剔除在两端同时进展。像这样循环往复地计算,直到所有该引入的变量都被引入,该剔除的变量均被剔除为止。数据准备6.2 计算方法计算方法 借助一个简单的实例说明逐步回归分析的方法。问题是山东省淄博市旅游业的开展分析,我们想搞清楚哪些因素影响淄博市的旅游总收入表6-2-1。所能考虑的
4、因素包括:国内游客数量、海外游客数量、第三产业的开展和人均GDP 数量m=4。从1995 年到2004年一共10 个年份的数据n=10。这些因素都与旅游业总收入具有明确的关系。而且,作为自变量,它们彼此之间也有很强的关系。如果将这四个变量全部引入模型,就会导致多重共线性的问题。为了得到简约、可靠的模型,需要借助逐步回归分析逐步回归分析技术。为了更为有效地说明问题,我们对表6-2-1 的变量排列顺序稍作调整表6-2-2 利用表6-2-2 的数据,容易计算相关系数,得到矩阵如下表6-2-3。逐步回归计算就是从这种相关系数矩阵出发的。将这个矩阵记为 首先设定F 统计量的临界值。取显著性水平=0.05
5、,我们有m=4个自变量,n=10个观测值。不妨取回归自由度为4、剩余自由度为n-m-1=10-4-1=5的临界值为我们引入变量的F 值下限,即取Fc(in)=5.192。另一方面,假定一个变量被淘汰,那么有m=3。我们取显著性水平=0.05、回归自由度为3、剩余自由度为n-m-1=10-3-1=6的F 临界值为剔除一个变量的上限,即取Fc(out)=4.757。这一步的计算可以分解为如下几个步骤。第一轮计算第一轮计算1计算自变量的奉献系数计算自变量的奉献系数2找出最大和最小奉献系数及其对应的变量序号找出最大和最小奉献系数及其对应的变量序号显然,等于0.98246最大,对应的变量序号v=1。因此
6、,首先考虑引入的变量是国内游客数量x1;等于0.92574最小,对应的变量序号v=4。故这一步可以考虑将人均GDP即变量x4剔除。国内游客数量这个变量是否能被引入模型,还要进展一次F 检验。对于我们的问题,n=10,现在计算第l=1步。3计算变量引入和剔除的计算变量引入和剔除的F 统计量统计量根据 这个数值远远大于我们设定的临界值Fc(in)=5.192,因此变量x1可以被引入模型。接下来考虑排除奉献系数最小的变量。但是否排除,要视Fout值而定。根据上述计算结果,0.92574最小,由式下面公式这个数值高于剔除变量的F临界值4.757,因此第一步不能剔除。作为比照,可以计算出所有变量的F 变
7、化值。例如,对于第二个变量“第三产业产值,变量引入和剔除的F 值分别为4相关系数矩阵变换,将相关系数矩阵变换,将 化为化为 假定第v个变量在第l步被引入,那么相关系数矩阵的第v个元素称为主元。矩阵变换是围绕主元进展的。相关系数矩阵的变换公式如下 式中j、k分别为相关系数矩阵的行列编号。根据这个公式,第一步应该改变非主元所在的行、列的元素 j v,k v,第二步改变主元所在的行的元素 j=v,k v,第三步改变主元所在的列的元素 j v,k=v,第四步改变主元本身 j=v,k=v。首先变换非主元所在的行和列的元素。首先变换非主元所在的行和列的元素。我们的主元在第j=1行、第k=1列,故非主元所在
展开阅读全文