医学统计学课件:直线回归(预防医学).ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《医学统计学课件:直线回归(预防医学).ppt》由用户(罗嗣辉)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 统计学 课件 直线 回归 预防
- 资源描述:
-
1、线性回归线性回归(linear regression)一、线性回归的概念一、线性回归的概念寻找两变量(寻找两变量(X,Y)的数量比例依从关系,)的数量比例依从关系,建立线性回归方程,以确定当建立线性回归方程,以确定当X为某一定为某一定值时值时Y的变动范围,此法称回归分析。的变动范围,此法称回归分析。其中其中:X表示独立变量或称自变量表示独立变量或称自变量(independent variable), X为固定的为固定的, 没有误差或误差很小;没有误差或误差很小;Y表示依存变量或称应变量表示依存变量或称应变量(dependent variable), 因因X的变化而随机变动的的变化而随机变动的,
2、 存在随机误存在随机误差。差。 二、简单线性回归方程的建立二、简单线性回归方程的建立 (一一)线性回归方程线性回归方程:bxay 表示由表示由X推算推算Y的估计值;的估计值;a:回归直线在回归直线在Y轴上的截距轴上的截距(intercept)即即X0时的时的y的估的估计值;计值;B:回归系数回归系数(regression coefficient)即直线的斜率即直线的斜率(slope),它表示当它表示当X每增加每增加(或减少或减少)一个单位时一个单位时, 随之增加随之增加(或或减少减少 )b个单位。个单位。y y (二)建立最适回归方程的条件:(二)建立最适回归方程的条件:1 1、直线上方各点离
3、回归线的距离(以平行、直线上方各点离回归线的距离(以平行Y Y轴计算)之和与直线下方各点离回归线的距轴计算)之和与直线下方各点离回归线的距离之和绝对值相等离之和绝对值相等, , 但方向相反。但方向相反。 2 2、此直线是使得误差平方和、此直线是使得误差平方和 为为最小值的直线最小值的直线, ,即应变量的实际观察值即应变量的实际观察值Y Y与理论与理论值值 之差的平方和取最小值。之差的平方和取最小值。 2)(yy y 最小二乘法最小二乘法(least square method)xxxyllb/xbyanxxxxlxx/222nyxxyyyxxlxy/使每个实测点到回归方程纵向距离的平方使每个实
4、测点到回归方程纵向距离的平方和,即和,即 最小的方法,称最小二乘法。最小的方法,称最小二乘法。2)(yy (三)直线回归方程的计算(三)直线回归方程的计算(1)(1)根据原始数据绘制散点图根据原始数据绘制散点图, , 若散点图呈直线若散点图呈直线趋势趋势, ,再进行进一步计算。再进行进一步计算。(2)(2)计算计算XX、XX2 2、YY、YY2 2、XYXY。(3)(3)计算计算x x、y y、l lxxxx、l lxyxy。(4)(4)计算回归系数计算回归系数b b和截距和截距a a。(5)(5)列出回归方程。列出回归方程。(6)(6)画直线(回归直线必定通过点画直线(回归直线必定通过点 )
5、。)。),(yx例例2 用分光光度计测物质含量用分光光度计测物质含量, 其光密度读数其光密度读数与物质含量有关与物质含量有关, 现有丙酮酸钠含量现有丙酮酸钠含量(mol/L)与光与光密度读数密度读数, 要求标准曲线。要求标准曲线。 表表4 4 丙酮酸钠含量与光密度读数丙酮酸钠含量与光密度读数 表表1 某大学一年级女生体重与肺活量某大学一年级女生体重与肺活量序序 号号 体体 重重 ( kg) 肺肺 活活量量 ( L) 1 42 2.55 2 42 2.20 3 46 2.75 4 46 2.40 5 46 2.80 6 50 2.81 7 50 3.41 8 50 3.10 9 50 3.46
6、10 52 2.85 11 58 3.50 12 58 3.00 三、线性回归方程的假设检验三、线性回归方程的假设检验(一)回归系数的显著性检验(一)回归系数的显著性检验 目的:目的:样本是否来自总体回归系数样本是否来自总体回归系数=0的总的总体体 1.平方和与自由度的分解平方和与自由度的分解 2.线性回归方程的显著性检验线性回归方程的显著性检验(1)方差分析法)方差分析法(2)t检验检验yy yyy yyyxypo图图5 5 应变量应变量Y Y的平方和划分示意图的平方和划分示意图第一段第一段 ,表示,表示P P点与回归直线的点与回归直线的纵向距离,即实际值与估计值之差。纵向距离,即实际值与估
7、计值之差。第二段第二段 ,表示估计值与均数之差。,表示估计值与均数之差。第三段第三段 ,表示应变量,表示应变量Y Y的均数。的均数。yyyyy) ()(yyyyyy Y Y的离均差平方和,即总平方的离均差平方和,即总平方和和(total sum of square),用用SSSS总总表示表示, , 说明未考虑说明未考虑X X与与Y Y的回归关系时的回归关系时Y Y的变异。的变异。总总= = 回回+ + 剩剩=N-1=N-12 yy222yyyyyy 22yyyyyyyyyyyyyy2220yyyy 回归值回归值 与平均数与平均数 之差之差的平方和的平方和, ,回归平方和回归平方和(regres
8、sion sum of square), 用用SSSS回回表示。表示。Y Y的这部分变的这部分变异是可以通过控制异是可以通过控制X X的值而避免的。或者的值而避免的。或者说作了回归后能使总平方和减少的部分说作了回归后能使总平方和减少的部分, , 所以该值越大所以该值越大, ,说明回归效果越好。说明回归效果越好。回回= =自由变量的个数自由变量的个数=1=1 Ms Ms回回SSSS回回/回回 2 yyy y 所有观察点距回归直线的剩余所有观察点距回归直线的剩余的平方和的平方和, , 它是除了它是除了X X对对Y Y的线性影响之外的的线性影响之外的一切因素对一切因素对Y Y变异的作用变异的作用,
9、, 称它为剩余平方称它为剩余平方和和( (或残差平方和或残差平方和) )(residual sum of square), , 用用SSSS剩剩表示表示, , 也就是在总平方和中也就是在总平方和中无法用无法用x x 解释的部分解释的部分. .在散点图中,各实测在散点图中,各实测点与回归直线越近,其值越小点与回归直线越近,其值越小, ,说明直线回说明直线回归的估计误差越小。归的估计误差越小。剩剩=N-2=N-2 Ms Ms剩剩SSSS剩剩/ /剩剩2 yy方差分析法方差分析法基本思想:将基本思想:将SSSS总总分解为分解为SSSS回回与与SSSS剩剩两个部分。两个部分。直线回归方程的显著性检验的
10、无效直线回归方程的显著性检验的无效假设是假设是H H0 0:0 (0 (为总体回归系为总体回归系数数) ) 公式:公式:F FMSMS回回/MS/MS剩剩 表表6 6 回归显著性检验方差分析表回归显著性检验方差分析表变变异异来来源源 自自由由度度 平平方方和和 均均方方 F F 值值 P P值值 回回归归 1 1 剩剩余余 N N- -2 2 总总变变异异 N N- -1 1 22 xxb1/22 xxb2 yy2yy 2/2Nyy22 xxb 2/2Nyy表表5 5 回归显著性检验方差分析表回归显著性检验方差分析表 回归系数回归系数b的的t检验检验1 1、标准估计误差(剩余标准差)、标准估计
展开阅读全文