医学精品课件:10第十章直线相关与回归.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《医学精品课件:10第十章直线相关与回归.ppt》由用户(金钥匙文档)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 精品 课件 10 第十 直线 相关 回归
- 资源描述:
-
1、,2020/4/6,1,医学统计学 人民卫生出版社,第十章 直线相关与回归,2020/4/6,2,学习目标 1.掌握:相关与回归的概念;相关系数与回归 系数的意义和计算;相关系数与回归 系数的假设检验。 2.熟悉:相关与回归的区别与联系;相关分析 与回归分析中应注意的问题;秩相关 的应用条件。 3.了解:最小二乘法原理;线性相关与回归的 应用。,2020/4/6,3,在前面我们所研究的资料仅涉及到一个变量,主要是描述该变量的统计特征或统计推断。譬如求出该变量的集中趋势和离散程度指标,对该变量进行均数的假设检验或进行方差分析等。然而,在医学研究中会涉及到两个或两个以上的变量,譬如,人的身高与体重
2、、体温与脉搏、年龄与血压、体重与肺活量等,它们之间存在一定的联系。,2020/4/6,4,变量间的关系,确定性关系(函数关系),非确定性关系(相关关系),如圆的面积公式:,人的身高与体重、体温与脉搏、年龄与血压、体重与肺活量,变量间非确定性关系称为相关关系(correlation),2020/4/6,5,第一节 直线相关 一、相关系数的意义 (一)散点图 数据点在平面直角坐系上的分布图称为散点图(scatter diagram)。散点图表示因变量随自变量而变化的大致趋势,当两正态分布变量在散点上的变化呈直线趋势时称为直线相关(linear correlation)或称简单相关(simple c
3、orrelation),反之称为非线性相关。(nonlinear correlation)。,2020/4/6,6,图10-1 几种常见的散点图,2020/4/6,7,相关的种类,按影响因素多少,按影响因素的表现方式,按相关的方向,按相关的程度,单相关,复相关,线性相关,非线性相关,正相关,负相关,完全相关,不完全相关,不相关,2020/4/6,8,(三)相关的程度和方向 用于描述两变量间相关密切程度和相关方向的指标称为相关系数(correlation coefficient),样本相关系数用符号r表示,总体相关系数用符号表示。相关系数没有单位,其取值范围为: 1r1。,2020/4/6,9,
4、一般认为,当样本含量较大的情况下(n100),大致可按下列标准估计两变量相关的程度: r0.7 高度相关 0.7r0.4 中度相关 0.4r0.2 低度相关,2020/4/6,10,二、相关系数的计算,(10-1),式中l与l分别为变量X与Y的离均差平方和,lXY为两变量X、Y的离均差积和,n为样本容量。,(10-2),(10-3),(10-4),2020/4/6,11,例10-1 某医师测量12名20岁健康男大学生的身高与前臂长,资料见表10-1。试求身高与前臂长的相关系数。,表10-1 12名20岁健康男大学生身高与前臂长资料,2020/4/6,12,解:(1)绘制散点图 如图10-2所示
5、。,图10-2 12名20岁男大学生身高与前臂长散点图,2020/4/6,13,表10-2 例10-1相关系数计算表,(2)列相关系数计算表 从图中可以知,这些点近似分布在一条直线上,呈线性相关。列出相关系数计算表,如表10-2所示。,2020/4/6,14,(2)计算相关系数r 已知 ,把表10-2的结果代入公式10-2,10-3,10-3,10-1得:,2020/4/6,15,三、相关系数的假设检验 在相关系数计算出来后,还不能认为这两个变量间就存在相关关系,因为它只是一个样本相关系数,仅为总体相关系数的估计值。要判断r是否来自总体相关系数=0的一个样本,还需对样本相关系数进行假设检验后,
6、才能判断两总体是否存在直线相关关系。相关系数的假设检验常用t检验法和查表法。,相关系数计算出来后,能否认为两变量间存在线性关系?不能,2020/4/6,16,(一)t 检验,自由度,(10-5),式中Sr为相关系数的标准误,n为样本含量。,2020/4/6,17,例10-2 对例10-1资料所得r值,检验20岁健康男大学生的身高与前臂长是否存在直线相关关系。 (1)建立检验假设,确定检验水准 H0:0,两变量间无直线相关关系 H1:0,两变量间有直线相关关系 =0.05,(2)计算r值 已知n=12,r=0.7953, 代入公式(10-5)、(10-6)得:,2020/4/6,18,(3)确定
7、值,作出推断结论 按n-2=10,查附表2,t 界值表,t0.002/2,10=3.930 ,现tr3.930,故P0.002。按的检验水准,拒绝H0,接受H1,可认为20岁健康男大学生的身高与前臂长呈正直线相关关系。,2020/4/6,19,(二)查表法 查附表11,r界值表,列出相关系数r与0差别有无统计学意义的判断界值,按自由度=n-2查r界值表,当rr/2,(n-2)时,则P,可认为两变量间存在直线相关关系;反之,rr/2,(n-2) 时,则P,则认为两变量间不存在直线相关关系。,2020/4/6,20,例10-3 对例10-1资料所得r值,用查表法检验20岁健康男大学生的身高与前臂长
8、是否存在直线相关关系。 解:本例r0.7953,按=10查附表11,得r0.002/2.10=0.795,现rr0.002/2,10,故P0.002,按的检验水准,拒绝H0,接受H1,可认为该地20岁健康男大学生的身高与前臂长呈正直线相关关系。检验结果与t检验相同。,2020/4/6,21,第二节 直线回归 一、直线回归的概念 在描述两变量X与Y的关系时,如果散点图呈直线趋势或有直线相关关系,就可以用一个直线方程来表示两个变量在数量上的依存关系,这个直线方程叫做回归方程(regression equation),用直线回归方程表示两个变量在数量上的依存关系的统计分析方法叫做回归分析。,2020
9、/4/6,22,二、直线回归方程的计算公式,(10-7),(10-8),(10-7),这里 就是给定X时Y的估计值,a为回归直线在Y轴上的截距(intercept),b为回归方程的斜率,称为回归系数(regression coefficient),,2020/4/6,23,三、直线回归方程的计算 例10-4 利用例10-1资料,已知12名20岁健康男大学生的身高与前臂长存在直线相关关系,现求身高与前臂长的直线回归方程。 计算步骤: (1)列回归系数计算表 同表10-2,求出X ,Y ,XY ,X2 , Y2 。 本例X=2079 ,Y=545 ,XY=94683 ,X2=361493 ,Y2=
10、24835。,2020/4/6,24,(2)求 、 、,前面已经计算出 =1306.25 , =261.75,(3)求回归系数b和截距a,2020/4/6,25,(4)列出回归方程 将求出的a和b代入公式(10-7)得出,(5)绘制回归方程图 本例取X1=155,则 ;X2=190,则 。在图上确定(155,41.77)和(190,48.78)两个点直线连接,即得出直线回归方程的图形,见图10-3。,2020/4/6,26,图10-3 12名20岁男大学生身高与前臂长回归直线,2020/4/6,27,三、回归系数的假设检验 求出回归方程后,还不断定X与Y就存在直线回归关系,这是因为b只是一个样
展开阅读全文