多元线性回归课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《多元线性回归课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 线性 回归 课件
- 资源描述:
-
1、多元线性回归 多元线性回归是简单线性回归的直接推广,其包含一个因变量和二个或二个以上的自变量。简单线性回归是研究一个因变量(Y)和一个自变量(X)之间数量上相互依存的线性关系。而多元线性回归是研究一个因变量(Y)和多个自变量(Xi)之间数量上相互依存的线性关系。简单线性回归的大部分内容可用于多元回归,因其基本概念是一样的。内容安排多元线性回归模型与参数估计回归方程和偏回归系数的假设检验标准化偏回归系数和确定系数多元回归分析中的若干问题回归分析中自变量的选择多元线性回归分析的作用多元线性回归模型与参数估计 设有自变量x1,x2,xp和因变量Y以及一份由n个个体构成的随机样本(x1i,x2i,xp
2、i,,Yi),且有如下关系:y=B0+B1x1+B2x2+Bp xp+(模型)B0、B1、B2和Bp为待估参数,为残差。由一组样本数据,可求出等估参数的估计值b0、b1、b2和bp,,得到如下回归方程:i=b0+b1x1+b2x2+bp xp 由此可见,建立回归方程的过程就是对回归模型中的参数(常数项和偏回归系数)进行估计的过程。参数的最小二乘估计 与简单回归类似,我们寻求参数B0、B1、B2和Bp的适宜估计数值b0、b1、b2和bp,,使实际观察值和回归方程估计值之间残差平方和最小,即 Q(yi i)2 =(yi b0b1x1ib2x2ibp xp i)2 对b0、b1、bp分别求偏导数,今
3、偏导数为零可获得P1个正规方程,求解正规方程可得待估参数值。回归方程和偏回归系数的假设检验回归方程的假设检验:建立回归方程后,须分析应变量Y与这p个自变量之间是否确有线性回归关系,可用F分析。H0:B1B2.=Bp=0 H1:H0不正确 0.05 F MS回归 /MS误差 MS回归 SS回归p SS回归=bjLjy (j=1,2.,P)MS误差 SS误差(n-p-1)SS误差为残差平方和 偏回归系数的假设检验 回归方程的假设检验若拒绝H0,则可分别对每一个偏回归系数bj作统计检验,实质是考察在固定其它变量后,该变量对应变量 Y 的影响有无显著性。H0:Bj=0 H1:Bj不为零 0.05 F
4、(Xj 的偏回归平方和1)/MS误差 Xj 的偏回归平方和:去Xj后回归平方和的减少量 若H0成立,可把Xj从回归方程中剔除,余下变量重新构建新的方程。标准化偏回归系数和确定系数 标准化偏回归系数:在比较各自变量对应变量相对贡献大小时,由于各自变量的单位不同,不能直接用偏回归系数的大小作比较,须用标准化偏回归系数。bj =bj(sj/sy)确定系数:简记为R2,即回归平方和SS回归与总离均差平方和SS总的比例。R2 SS回归 SS总 可用来定量评价在Y的总变异中,由P个X变量建立的线性回归方程所能解释的比例。回归分析中的若干问题 资料要求:总体服从多元正态分布。但实际工作中分类变量也做分析。n
5、足够大,至少应是自变量个数的5倍 分类变量在回归分析中的处理方法 有序分类:治疗效果:x=0(无效)x=1(有效)x=2(控制)无序分类:有k类,则用k1变量(伪变量)如职业,分四类可用三个伪变量:y1 y2 y3 工人 1 0 0 农民 0 1 0 干部 0 0 1 学生 0 0 0 多元线性回归方程的评价 评价回归方程的优劣、好坏可用确定系数R2和剩余标准差Sy,x1,2.p 。Sy,x1,2.p SQRT(SS误差n-p-1)如用于预测,重要的是组外回代结果。回归方程中自变量的选择 多元线性回归方程中并非自变量越多越好,原因是自变量越多剩余标准差可能变大;同时也增加收集资料的难度。故需寻
6、求“最佳”回归方程,逐步回归分析是寻求“较佳”回归方程的一种方法。选择变量的统计学标准 R2最大 R2 SS回归 SS总 adjR2最大:adjR21MS误差/MS总 Cp值最小 Cp(n-p-1)(MS误差.p/MS误差.全部1)(p+1)选择变量的方法 最优子集回归分析法:p个变量有2p1个方程 逐步回归分析向前引入法(forward selection)向后剔除法(backward selection)逐步引入剔除法(stepwise selection)H0:K个自变 量为好 H1:K1个自变量为好 向前引入法(forward selection)自变量由少到多一个一个引入回归方程。将
7、 corr(y ,xj)最大而又能拒绝H0者,最先引入方程,余此类推。至不能再拒绝H0为止。向后剔除法(backward selection)自变量先全部选入方程,每次剔除一个使上述检验最不能拒绝H0者,直到不能剔除为止。逐步引入剔除法(stepwise selection)先规定两个阀值F引入和F剔除,当候选变量中最大F值F引入时,引入相应变量;已进入方程的变量最小FF剔除时,剔除相应变量。如此交替进行直到无引入和无剔除为止。(计算复杂)多元线性回归方程的作用 因素分析 调整混杂因素的作用 统计预测例:测量16名四岁男孩心脏纵径X1(CM)、心脏横径X2(CM)和心象面积Y(CM2)三项指标
展开阅读全文