第五章-多元线性回归课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第五章-多元线性回归课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第五 多元 线性 回归 课件
- 资源描述:
-
1、第二章 多元线性回归(multiple linear regression)第一节相关和回归第一节相关和回归第二节一元线性回归模型第二节一元线性回归模型第三节多元线性回归模型第三节多元线性回归模型第四节方程的解释能力第四节方程的解释能力第五节回归方程的检验和回归系数的推断统计第五节回归方程的检验和回归系数的推断统计第六节虚拟变量的应用第六节虚拟变量的应用第七节多重共线性及其解决方案第七节多重共线性及其解决方案第八节计算机应用第八节计算机应用第九节研究实例第九节研究实例参见郭志刚主编,社会统计分析方法SPSS软件应用第二章,中国人民大学出版社1999第一节 相关和回归n一、相关统计量n用一个数值
2、表示两个变量间的相关程度(无单位度量)(-1+1)解读nX与y的相关系数为0.6,x与z的相关系数为0.3n答案:n只能说明x与y相关程度高于x与z的相关程度,但不能说前者是后者的两倍n二、计算相关的思路二、计算相关的思路n定距:数量上的数量上的“共变共变”n定类、定序:“连同发生连同发生”隐含根据一个变量去预测或估计另一个变量的意思n人们正是根据预测的准确程度来界定定类或定序变量之间的关系的消减误差比例n三、相关测量逻辑展示三、相关测量逻辑展示n(一)Lambda相关测量法n基本逻辑:以一个定类变项的值来预测另一个定类变项的值时,如果以众值作为预测准则,可以减少多少误差n公式:MMmMmMM
3、MmMmMMMMMmmyyyxxx121xyyyyyy121yyxyxyxn)()()(n)()()(2n)(nnnnnnEEEEEE(不对称)(不对称)()(对称练习:根据下表数据计算lambda志愿性别男女总数快乐家庭103040理想工作401050增广见闻10010总数60401004.05020)50100(50)3040(n)2(4.0503050)50100()3040(100)50100()()()()1(MMmMmMyyyyyy121ynnnEEE(不对称)思考并运算:如果数据有如下变化,lambda值会发生什么变化呢?志愿性别男女总数快乐家庭101020理想工作403070增
4、广见闻10010总数6040100n存在的问题:n1、Lambda系数以众值为预测准则,不理会众值以外的次数分布,对数据利用率低。n2、因为上述计算方式,如果全部众值集中如果全部众值集中在条件次数表的同一列或同一行中,则在条件次数表的同一列或同一行中,则LambdaLambda系数会等于系数会等于0 0,相关失去意义,相关失去意义n(二)相关系数(二)相关系数rn1、协方差的思想n2、r系数计算n3、PRE计算思路为决定系数222)()()(ryyxxyyxxr四、回归n回归是相关分析的深入n回归分析的结果是建立一个数学模型以表达变量之间的关系在分析观测数据的在分析观测数据的基础上,确定一个能
5、反映变量之间关系的基础上,确定一个能反映变量之间关系的近似函数表达式近似函数表达式1(多)个(多)个定距(类)变量定距(类)变量1个个定距变量定距变量注意n回归模型只是整个研究方案中的一环,它必须依赖理论和经验的支撑,服从研究设计的需要,在研究方法论的指导下展开研究变量间的因果关系研究变量间的因果关系预测预测是否吻合预先构想是否吻合预先构想评价模型拟合度评价模型拟合度求解模型参数求解模型参数第二节一元线性回归第二节一元线性回归参见:卢叔华参见:卢叔华社会统计学社会统计学,北京大学出版社,北京大学出版社1997 第十二章第十二章 回归与相关回归与相关一、回归方程与线性回归方程二、回归方程的建立与
6、最小二乘法三、回归方程的假定与检验一、回归方程与线性回归方程n两变量x与yn对于确定的xi,yi是随机变量,可计算其均值回归方程是研究自变量不同取值时,y的均值的变化n当因变量y的均值与自变量x呈线性规律时,称线性回归方程n根据x个数不同,分为一元线性回归、多元线性回归关于模型n现实数据=模型+误差n没有误差的不是模型,是复制n复制很精确,但是往往太不简洁n设置模型一般而言是希望用简洁的方式表述复杂信息,达到较好的精确度二、回归方程的建立与最小二乘法n回归分析的目的:找出错误最小的方法来预测因变量的数值n拟合思路:各点到待估直线铅直距离之和为最小最小二乘 n原理:n(1)散点图n(2)每个x值
7、对应的y的均值,构成回归线(曲折)n(3)用最小平方法绘制回归直线n(各个样本个案的估计误差和为误差总数。为避免正负抵消,改为将误差的平方值相加。如果回归直线位置能够使此平方和最小,即为最佳拟和直线)n线性回归方程式不但有简化资料的作用,而且可以推广应用于预测或估计样本以外之个案的数值aybx2()()()iiixx yybxxn回归系数的意义:nb值的大小表示每增加一个单位的x值,y值的变化有多大三、回归方程的假定与检验n(一)基本假定n1、自变量x可以是随机变量,也可以是非随机变量,其误差忽略不计n2、对于每一个x值,yi都是随机变量。Y的所有子总体y1,y2yn,方差相等n3、y的所有子
8、总体,其均值都在一条直线上线性假定n4、随机变量yi是统计独立的n5、y的所有子总体都满足正态分布n(二)检验nF检验第三节 多元线性回归模型n一、多元的思路n二、回归方程的建立n三、回归方程的解释n四、标准化回归系数一、多元的思路n关联性 Association 和因果性Causalityn统计意义上的关联性很容易发现,难的是,如何确立因果联系。n然而我们在研究中更加关心的是因果性的解释。n因果关系存在的必要条件:n1、变量间的关系是strong and consistent;n2、变量间有适当的时序性;n3、变量间的关系不能够被其他变量所解释。对观察数据的统计控制n我们如何排除其他备选解释
9、?n和实验室的实验不同的是,我们不能控制社会现象发生的环境。n对于观察数据,因果性问题可以部分地通过统统计控制计控制来解决n即,我们可以把个体根据我们所要控制的特征分成几个小组,来比较组内的结果变量的差异n对定量变量最常用的统计控制体现在多元回归模型中。二、回归方程的建立eyxbxbxbbkk.22110 xbxbxbbkky.22110bi多元回归系数的估计多元回归系数的估计n首先看只有两个自变量的模型:n我们仍可以用最小二乘法,使得观测的Y值和预测的Y值的差距的平方和最小。利用微积分,Let Z(a,b1,b2)=(Y-a-b1X1-b2X2)2xbxbay2211n对三个未知参数a,b1
10、,and b2 求导:Zab baa bbXiiYX(,)()()()121221 20 Z a b bbXa bb XYX(,)()()()1211112220 Z a b bbXa bb XYX(,)()()()1222112220 n解方程:a Y b X b X _1122bXX Y YXXXX Y YXX XXXXXXXX XX11122222112211222211222()()()()()()()()()()()_bXX Y YXXXX Y YXX XXXXXXXX XX22211211112211222211222()()()()()()()()()()()_n这种方法可以扩展
展开阅读全文