(统计分析)简单线性回归课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《(统计分析)简单线性回归课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计分析 简单 线性 回归 课件
- 资源描述:
-
1、第十一章 简单线性回归Linear regressionn回归是设法找出变量间在数量上的依存变化关系,用函数表达式表达出来,这个表达式称之为回归方程。两变量间的关系n确定性关系:两变量间的函数关系 圆的周长与半径的关系:C2R 速度、时间与路程的关系:LST X与Y的函数关系:Ya+bX n非确定性关系:两变量在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄的关系;身高与体重的关系:标准体重(kg)=身高(cm)-105 药物浓度与反应率的关系;一、线性回归的概念一、线性回归的概念n当两个变量存在当两个变量存在准确、严格的准确、严格的直线关系时,可以用直线关系时,可以用Y=
2、a+bX,表示两者的函数关系。表示两者的函数关系。n其中其中X 为为自变量(自变量(independent variable););Y是因变量是因变量(dependent variable)。)。n但在实际生活当中,由于其它因素的干扰,许多双变量之但在实际生活当中,由于其它因素的干扰,许多双变量之间的关系并不是严格的函数关系,不能用函数方程来准确间的关系并不是严格的函数关系,不能用函数方程来准确反映,为了区别于两变量间的函数方程,我们称这种关系反映,为了区别于两变量间的函数方程,我们称这种关系为回归关系,用直线方程来表示这种关系称为回归直线或为回归关系,用直线方程来表示这种关系称为回归直线或线
3、性回归。线性回归。Yabx小插曲:为什么叫”回归“?F.Galton K.Pearson二、回归参数的估计二、回归参数的估计n式中的式中的 是由自变量是由自变量X推算应变量推算应变量Y的估计值,的估计值,a是回归直是回归直线在线在Y 轴上的轴上的截距截距;b为样本的为样本的回归系数回归系数,即回归直线的斜,即回归直线的斜率,表示当率,表示当X变动一个单位时,变动一个单位时,Y平均变动平均变动b个单位。个单位。n计算原理:计算原理:最小二乘法最小二乘法,即保证各实测点到回归直线的纵,即保证各实测点到回归直线的纵向距离的平方和最小,并使计算出的回归方程最能代表实向距离的平方和最小,并使计算出的回归
4、方程最能代表实测数据所反映出的直线趋势。测数据所反映出的直线趋势。YabxY22YYYabXXbYaXXXYllXXYYXXb 2)()(例例11-1 某医师为了研究正常成年男性的运动某医师为了研究正常成年男性的运动后最大心率与年龄的关系,测得后最大心率与年龄的关系,测得20名正常成年男名正常成年男性的有关数据,散点图如下。性的有关数据,散点图如下。年龄504846444240383634心率200190180170160150140130年龄与运动后最大心率的回归方程 41.8 166.8381.2 4477.2 1226.8XXYYXYX Ylll=-1226.8 3.218381.2XY
5、XXlbl-=-301.31243.218YX=-166.8-(-3.218)41.8301.3124a=回归系数和回归方程的意义及性质回归系数和回归方程的意义及性质nb 的意义na 的意义n 的意义n 的意义n 的意义bXaY YY niiiYY12 Yb 的意义n斜率(slope)n 301.3124-3.218 Xn 年龄每增加 1 岁,其运动后最大心率平均减少 3.218(次/分钟)nb 的单位为(Y的单位/X的单位)Y b0,y increase with the increase of X b0b F0.05(1,18),P0.05,拒绝拒绝H0 H0:=0 H1:0 =0.05t
6、检验法22,0()/bbvnSy xblxxbXXSSvtss剩余剩余 Sb是样本回归系数的标准误是样本回归系数的标准误nH 0:0,nH 1:0,n=0.05。()2.529.0409529.0409,5.42142025.42140.2777381.23.21811.588,18,P0.0010.2777Y XbbYYsstv-=-=-=-=年龄与运动后最大心率间存在回归关系。决定系数决定系数(coefficient of determination)n 取值在0到1之间,反映了回归贡献的相对程度。n决定系数除了作为回归拟合效果的概括统计量,还可利用它对回归方程做假设检验。2SSRSS回总
7、2R22(1)(2)MSRkFRnMS回剩四、回归问题的区间估计四、回归问题的区间估计n回归系数的可信区间估计n估计值 的可信区间估计n个体Y值的容许区间估计 Y 总体回归系数 的可信区间估计n根据 t 分布原理估计:n-3.2182.1010.2777-3.8014-2.63462 0 nsbtbb,bnstb2,的可信区间估计总体回归线的95%置信带 Y 样本 总体Y的总平均给定X时Y的平均 (Y的条件均数)YYY 22.2,2,)()(1XXXXnstYstYXYnYn n根据 t 分布原理:的容许区间估计个体Y值的容许区间 22.2,2,)()(11XXXXnstYstYXYnYn n
展开阅读全文