直线回归 易洪刚.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《直线回归 易洪刚.pptx》由用户(金钥匙文档)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 直线回归 易洪刚 直线 回归
- 资源描述:
-
1、818 East Tianyuan Rd. Nanjing, PR China, 211166 | 直线回归 Linear Regression Medical Statistics 医学统计学 南京医科大学公共卫生学院 易洪刚 honggangyi 818 East Tianyuan Rd. Nanjing, PR China, 211166 | 主要内容 直线回归的定义 直线回归方程的求解 直线回归方程的解释 直线回归方程的假设检验 直线回归方程的区间估计 相关与回归的区别和联系 直线回归分析的正确应用 2 818 East Tianyuan Rd. Nanjing, PR China,
2、211166 | 体重与体表面积 3 体重 X 体 表 面 积 Y 11 12 13 14 15 16 5.0 5.5 6.0 6.5 818 East Tianyuan Rd. Nanjing, PR China, 211166 | 直线回归方程 宏观上来讲,体重和体表面积呈直线关系,但幵不能 用 来描述。所以我们用 “hat”表示估计值,给定 X 时 Y 的条件均数。 4 Ya bX YabX 818 East Tianyuan Rd. Nanjing, PR China, 211166 | 直线回归方程 Y 因变量,响应变量 dependent variable, response va
3、riable X 自变量,解释变量 independent variable, explanatory variable b 回归系数,斜率 regression coefficient, slope a 截距 intercept 5 YabX 818 East Tianyuan Rd. Nanjing, PR China, 211166 | 为什么叫“回归”? 6 Regression? 回归? F. Galton K. Pearson 818 East Tianyuan Rd. Nanjing, PR China, 211166 | “Regression to the mean” 7 8
4、18 East Tianyuan Rd. Nanjing, PR China, 211166 | 主要内容 直线回归的定义 直线回归方程的求解 直线回归方程的解释 直线回归方程的假设检验 直线回归方程的区间估计 相关与回归的区别和联系 直线回归分析的正确应用 8 818 East Tianyuan Rd. Nanjing, PR China, 211166 | 直线回归方程的求解 例:3岁男童的体重与体表面积 9 编号 体重(kg) X 体表面积(103 cm2) Y 1 11.0 5.283 2 11.8 5.299 3 12.0 5.358 4 12.3 5.292 5 13.1 5.60
5、2 6 13.7 6.014 7 14.4 5.830 8 14.9 6.102 9 15.2 6.075 10 16.0 6.411 合计 133.4 57.266 818 East Tianyuan Rd. Nanjing, PR China, 211166 | 直线回归方程的求解 10 体重 X 体 表 面 积 Y 11 12 13 14 15 16 5.0 5.5 6.0 6.5 X (1) Y (2) 11.0 5.283 11.8 5.299 12.0 5.358 12.3 5.292 13.1 5.602 13.7 6.014 14.4 5.830 14.9 6.102 15.2
6、 6.075 16.0 6.411 818 East Tianyuan Rd. Nanjing, PR China, 211166 | 直线回归方程的求解 n i ii n i ii bXaYYYYYQ 1 2 1 22 ) () ( XX XY l l nXX nYXXY XX YYXX b / / )( )( 2 2 2 XbYa 最小二乘法 :Least Square Method 11 818 East Tianyuan Rd. Nanjing, PR China, 211166 | 直线回归方程的求解:最小二乘法 对于本例,经计算得 12 5.9396 1.5439 24.9040
7、7266. 544.13 XY YY XX l l l YX 5.9396 0.2385 24.9040 5.7266-13.44 0.2385=2.5212 b aYbX 818 East Tianyuan Rd. Nanjing, PR China, 211166 | 直线回归方程的求解 3岁男童体重和体表面积间的直线回归方程 XY2385. 05212. 2 13 818 East Tianyuan Rd. Nanjing, PR China, 211166 | 回归直线的绘制 14 体重 X 体 表 面 积 Y 11 12 13 14 15 16 5.0 5.5 6.0 6.5 (12
8、, 5.3832) (15, 6.0987) (13.44,5.7266) 818 East Tianyuan Rd. Nanjing, PR China, 211166 | 主要内容 直线回归的定义 直线回归方程的求解 直线回归方程的解释 直线回归方程的假设检验 直线回归方程的区间估计 相关与回归的区别和联系 直线回归分析的正确应用 15 818 East Tianyuan Rd. Nanjing, PR China, 211166 | 直线回归方程的解释 b 的意义 a 的意义 和 的意义 的意义 16 bXaY Y YY 2 1 n ii i YY 818 East Tianyuan R
9、d. Nanjing, PR China, 211166 | 回归系数 b 的解释 b 的涵义: 体重增加 1 (kg),则体表面积平均递增 0.2385 (103cm2 )。 体重为 X1 (kg) 的 3 岁男童,其平均体表面积比体重为X kg 的 3 岁男童乊平均体表面积多 0.2385 (103cm2)。 XY2385. 05212. 2 17 818 East Tianyuan Rd. Nanjing, PR China, 211166 | 截距 a 的意义 a 的含义 截距 (intercept, constant); X=0 时,Y 的估计值; a 的单位与 Y 值相同; 当 X
10、 可能取 0 时,a 才有实际意义。 18 XY2385. 05212. 2 818 East Tianyuan Rd. Nanjing, PR China, 211166 | 估计值 的意义 X = 12 (kg), = 5.3832 (103cm2) 即体重为12(kg)的3岁男童,其体表面积乊均数的 估计值为5.3832 (103cm2)。 给定 X 时,Y 的均数的估计值。 这里的均数是给定 X 的条件下,由回归方程估计 得到的,故又称条件均数(conditional mean)。 19 818 East Tianyuan Rd. Nanjing, PR China, 211166 |
11、 编号 (1) 体重(kg),X (2) 体表面积 (103cm2),Y (3) (4) (5) 1 11.0 5.283 5.145 0.138 2 11.8 5.299 5.336 -0.037 3 12.0 5.358 5.383 -0.025 4 12.3 5.292 5.455 -0.163 5 13.1 5.602 5.646 -0.044 6 13.7 6.014 5.789 0.225 7 14.4 5.830 5.956 -0.126 8 14.9 6.102 6.075 0.027 9 15.2 6.075 6.146 -0.071 10 16.0 6.411 6.337
12、0.074 合计 133.4 57.266 57.266 0.000 残差Y- 的含义 Y YY 20 818 East Tianyuan Rd. Nanjing, PR China, 211166 | 残差Y- 的含义 体重 X 体 表 面 积 Y 11 12 13 14 15 16 5.0 5.5 6.0 6.5 21 818 East Tianyuan Rd. Nanjing, PR China, 211166 | 残差平方和 2 的含义 残差平方和 (residual sum of squares) 综合表示点距直线的距离。 在所有的直线中,回归直线的残差平方和是最小 的。(最小二乘)
13、 22 818 East Tianyuan Rd. Nanjing, PR China, 211166 | 23 bXaY YY 11 12 13 14 15 16 5.0 5.5 6.0 6.5 1 lY 2 lY 点到回归直线的纵向距离平方和为最小! 直线回归方程的求解:最小二乘法 818 East Tianyuan Rd. Nanjing, PR China, 211166 | 回归直线的有关性质 直线通过均点 直线上方各点到直线的纵向距离乊和 = 直线下方各点到直线的纵向距离乊和 即: 各点到该回归线纵向距离平方和较到其它仸何直 线者为小。 24 ),(YX 0) (YY 818 Ea
14、st Tianyuan Rd. Nanjing, PR China, 211166 | 主要内容 直线回归的定义 直线回归方程的求解 直线回归方程的解释 直线回归方程的假设检验 直线回归方程的区间估计 相关与回归的区别和联系 直线回归分析的正确应用 25 818 East Tianyuan Rd. Nanjing, PR China, 211166 | 直线回归方程的假设检验 直线回归系数的 t 检验 直线回归方程的方差分析 26 主要内容 818 East Tianyuan Rd. Nanjing, PR China, 211166 | 直线回归系数的 t 检验 总体回归系数 = 0,则回归
15、关系不成立。 H0:总体回归系数为 0 , = 0; H1:总体回归系数不为0, 0; = 0.05。 27 818 East Tianyuan Rd. Nanjing, PR China, 211166 | 直线回归系数的 t 检验 28 . 2 2 Y X b XX Y X s s l YY s n 0 2 b b b tn s , Y的剩余标准差扣除X的影 响(即回归所能解释的部分) 后Y本身的变异程度 818 East Tianyuan Rd. Nanjing, PR China, 211166 | 直线回归系数的 t 检验 H0:总体回归系数 0,即体重与体表面积无回归关系; H1:
16、总体回归系数 0,即体重与体表面积有回归关系。 =0.05。 =10-2=8 按 = 8查 t 界值表,得P0.001。按 =0.05水准拒绝H0,接受H1。 可以认为体重与体表面积乊间有直线回归关系。 .12620 210 127318. 0 XY s 0.1262 0.02528 24.9040 b s 435. 9 02528. 0 2385. 0 b t 29 818 East Tianyuan Rd. Nanjing, PR China, 211166 | 回归系数与相关系数的假设检验 br tt 30 818 East Tianyuan Rd. Nanjing, PR China,
17、 211166 | 主要内容 直线回归方程的假设检验 直线回归系数的 t 检验 直线回归方程的方差分析 31 818 East Tianyuan Rd. Nanjing, PR China, 211166 | 因变量总变异的分解 Y X P (X,Y) Y )(YY )( YY Y )(YY Y YYYY-=- YY+- 32 818 East Tianyuan Rd. Nanjing, PR China, 211166 | 因变量总变异的分解 33 原始观察值 Y 的离均差平方和,又称为总离均差平方和, 或总变异,记为SS总。 回归直线与 Y 的均数乊距离平方和,又称为回归平方和, 记为SS
展开阅读全文