双变量回归与相关培训课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《双变量回归与相关培训课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 变量 回归 相关 培训 课件
- 资源描述:
-
1、双变量回归与相关概念:概念:回归与相关是研究两个或多个变量之间相互关系的回归与相关是研究两个或多个变量之间相互关系的一种分析方法一种分析方法。回归:回归:是研究变量之间在数量上依存关系的一种方法。是研究变量之间在数量上依存关系的一种方法。相关:相关:是研究随机变量之间相互联系密切程度和方向的方法是研究随机变量之间相互联系密切程度和方向的方法。直线相关与回归:直线相关与回归:只涉及两个变量,而且分析是否呈直线关系,是回只涉及两个变量,而且分析是否呈直线关系,是回归、相关分析中最简单的一种。又称简单相关和回归归、相关分析中最简单的一种。又称简单相关和回归。一、直线回归一、直线回归1.直线回归方程直
2、线回归方程 :X为某值时应变量为某值时应变量Y的平均估计值的平均估计值a:截距:截距b:回归系数:回归系数注意注意:直线回归方程与函:直线回归方程与函数方程的不同数方程的不同 Y=a+bX表 6.1 20 名糖尿病人血糖(mmol/L)与胰岛素(mU/L)测定值 病例号 血糖 胰岛素 I YI Xi 病例号 血糖 胰岛素 I Yi Xi1 12.21 15.22 14.54 16.73 12.27 11.94 12.04 14.05 7.88 19.86 11.10 16.27 10.43 17.08 13.32 10.39 19.59 5.910 9.05 18.711 6.44 25.11
3、2 9.49 16.413 10.16 22.014 8.38 23.115 8.49 23.216 7.71 25.017 11.38 16.818 10.82 11.219 12.49 13.720 9.21 24.4 20名糖尿病人的血糖水平与胰岛素水平的散点图名糖尿病人的血糖水平与胰岛素水平的散点图直线回归方程的求法直线回归方程的求法 原理(最小二乘法):原理(最小二乘法):各散点距离回归直线各散点距离回归直线纵向纵向距离平方和为最小而得到直线。距离平方和为最小而得到直线。计算:计算:回归直线必通过点回归直线必通过点xxxyll 资料要求:资料要求:应变量应变量Y服从正态分布,通常自变
4、量服从正态分布,通常自变量X为为可以精确测量或严格控制的因素。可以精确测量或严格控制的因素。2.建立直线回归方程的具体步骤建立直线回归方程的具体步骤表 6.1 20 名糖尿病人血糖(mmol/L)与胰岛素(mU/L)测定值 病例号 血糖 胰岛素 I YI Xi 病例号 血糖 胰岛素 I Yi Xi1 12.21 15.22 14.54 16.73 12.27 11.94 12.04 14.05 7.88 19.86 11.10 16.27 10.43 17.08 13.32 10.39 19.59 5.910 9.05 18.711 6.44 25.112 9.49 16.413 10.16
5、22.014 8.38 23.115 8.49 23.216 7.71 25.017 11.38 16.818 10.82 11.219 12.49 13.720 9.21 24.4 20名糖尿病人的血糖水平与胰岛素水平的散点图名糖尿病人的血糖水平与胰岛素水平的散点图绘制散点图观察两变量见是否呈直线趋势绘制散点图观察两变量见是否呈直线趋势正 态性 检验.13820.200*.91420.078.12520.200*.95920.522yx统计量dfSig.统计量dfSig.Kolmogorov-SmirnovaShapiro-Wilk这 是 真 实显 著 水 平 的 下 限。*.Lillief
6、ors 显 著 水 平修 正a.H0:正态分布正态分布H1:非正态分布非正态分布 =0.10 x x,y y是否服从正态分布是否服从正态分布 X =346.6,Y=217.00,X2=6552.16,Y2=2517.1014 XY=3510.45,n=20,X=17.33,Y=10.85 7961.1833.17)4585.0(85.10 xbya0.4585545.582250.16/n(x)x(x)(y)/n-xyb22xy4585.07961.18 即推断总体回归系数(即推断总体回归系数()是否为零)是否为零(1)方差分析方差分析 即:即:SS总总=SS回归回归+SS残余残余3.直线回归
7、的假设检验直线回归的假设检验查附表查附表3,P698,F0.01(1,18)=8.29 P 0.01农村相对贫困,店铺经营不稳定。因此,针对农村客户设计了两层型的冰柜,有两个分离式的压缩机,省电的时候使用上层,里面的结构非常简单,降低成本和价格。这就是服务的策略,产品的设计能够满足顾客的细分化的技巧。5、不得占用公共走道,原占用的必须打通。4.2熟悉本单位工艺流程和设备技术标准,有较强的专业知识,具有重大事故的处理能力。_2、人员监控、管理:4 知识产权成为OTC药的直接使用点;8.1 卖方应提供买方要求的有关合同项下由卖方提供的备品备件。成功企业案例(一)成交候选供应商存在违法、违纪行为的;
8、(2)检验检验H0:=0H1:0bSbt0(0.4585 0)/0.0699=6.56 =18,t0.01(18)=2.878 P 0.01F=t2=(-6.56)2=43.03(1)描述两分析变量间的数量依存变化关系)描述两分析变量间的数量依存变化关系4.4.直线回归方程的应用直线回归方程的应用xy4585.07961.18表 6.1 20 名糖尿病人血糖(mmol/L)与胰岛素(mU/L)测定值 病例号 血糖 胰岛素 I YI Xi 病例号 血糖 胰岛素 I Yi Xi1 12.21 15.22 14.54 16.73 12.27 11.94 12.04 14.05 7.88 19.86
9、11.10 16.27 10.43 17.08 13.32 10.39 19.59 5.910 9.05 18.711 6.44 25.112 9.49 16.413 10.16 22.014 8.38 23.115 8.49 23.216 7.71 25.017 11.38 16.818 10.82 11.219 12.49 13.720 9.21 24.44.直线回归方程的应用直线回归方程的应用(2)预测预测:1)点预测:)点预测:一般把易于测定、控制的变量作为自变量,建一般把易于测定、控制的变量作为自变量,建立回归方程,然后对难以测定或控制的变量值进行立回归方程,然后对难以测定或控制的变
10、量值进行预测。预测。2)区间预测:)区间预测:当当X是已知时,按一定概率估计是已知时,按一定概率估计应变量值应变量值或其或其均数均数所在范围所在范围当当X为某固定值为某固定值X0时,时,总体均数(总体均数()的可信区间)的可信区间2)()(1.220.000 nSSMSSxxxxnSSstyxyxyyy剩余(残)剩余(残)剩余剩余 0 y0XY 例例6.1资料资料,当当 X0=15 mU/L,求,求 总体均总体均数的数的95%可信区间。可信区间。即:即:11.918 2.1010.3396=(11.08,12.76)3996.053.545)33.1715(201632.120 yS018,0
11、5.00ysty 9182.11154585.07957.180 y101.218,05.0t0 y个体个体Y值的预报区间(容许区间)值的预报区间(容许区间)意义意义:当当X是某一固定值是某一固定值X0时,按一定概率估时,按一定概率估计应变量计应变量Y0的波动范围。的波动范围。220.0)()(1100 xxxxnSSstyxyyy 6.1资料,当资料,当X=15,求,求Y的波动范围(的波动范围(=0.05)669.153.545)33.1715(2011632.12yS不同与注意:.yystysty15.42),41.8(669.1101.2918.11 某地疾控中心根据某地疾控中心根据10
12、年来乙脑发病率(年来乙脑发病率(1/10万,万,Y)与相应前一年与相应前一年7月份日照时间(小时,月份日照时间(小时,X)建立回归方)建立回归方程,将乙脑发病率做平方根反正弦变换,即程,将乙脑发病率做平方根反正弦变换,即求得回归方程求得回归方程已知已知7月份日照时间月份日照时间X=260小时,试估计小时,试估计该地该地的乙脑发病率(设的乙脑发病率(设=0.05)。)。Yy1 sinxy006801971.10569002230 nlSxxxy ,237.43,x ,.万之间。即(得:(取原函数,双侧,11.97/108.08,0.0001197),.,)sin).,.().(.,.).(.00
13、0080806270515002430306257103062571026000680197102430569043237260101102230280502yYtysy (3)控制控制:指当要求因变量指当要求因变量Y在一定范围内波动时,如何控制自变在一定范围内波动时,如何控制自变量量X的取值。的取值。例例:已知血糖正常范围为(:已知血糖正常范围为(4.446.66 mmol/L),在例),在例6.1资料的基础上,问欲将血糖水平控制在正常范围内时,血中资料的基础上,问欲将血糖水平控制在正常范围内时,血中胰岛素应维持在什么范围内?胰岛素应维持在什么范围内?(=0.05)632.1101.2)45
14、85.07961.18(66.6632.1101.2)4585.07961.18(44.418,05.018,05.0 xstyxstyyy解得:解得:X(33.95,38.79)mU/L(4)(4)利用回归方程获得精度更高的参考值范围利用回归方程获得精度更高的参考值范围100 例正常人胆固醇含量与年龄有关,资料如下表:例正常人胆固醇含量与年龄有关,资料如下表:正常组正常组 年龄(年龄(X)胆固醇(胆固醇(Y)48 3.5 33 4.6 51 5.8 43 5.8 44 4.9 63 8.7 49 3.6 42 5.5 40 4.9 47 5.1 41 4.1 41 4.6 56 5.1 xy
展开阅读全文