直线相关与回归Linearcorrelationandregression课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《直线相关与回归Linearcorrelationandregression课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 直线 相关 回归 Linearcorrelationandregression 课件
- 资源描述:
-
1、 前面介绍的统计方法都只涉及前面介绍的统计方法都只涉及单一变量单一变量,即或,即或进行进行两组或多组比较两组或多组比较,所比较的仍然是,所比较的仍然是同一变量同一变量,而且是以讨论各组间该变量的而且是以讨论各组间该变量的相差是否显著相差是否显著为中为中心环节。心环节。医学领域里常可在一个统一体中遇到医学领域里常可在一个统一体中遇到两个或多个两个或多个变量之间存在着相互联系、相互制约的情况变量之间存在着相互联系、相互制约的情况.如如:同一批水样的同一批水样的浊度浊度与与透光率透光率,同一批人的,同一批人的年龄年龄与与血压血压以及以及身长、体重与胸围身长、体重与胸围等。等。在统计方法中通常是用相关
2、与回归的方法来研究在统计方法中通常是用相关与回归的方法来研究不同变量之间不同变量之间的这种的这种相互依存相互依存和和互为消长互为消长的关系。的关系。相关与回归即有相关与回归即有区别又有联系区别又有联系,表达事物或现象,表达事物或现象间的在数量方面间的在数量方面相互关系的密切程度用相关系数相互关系的密切程度用相关系数;说明说明一变量依另一变量的消长而变动的规律用回一变量依另一变量的消长而变动的规律用回归方程。归方程。函数关系:函数关系:确定。例如园周长与半径:确定。例如园周长与半径:y=2r。一一对应关系。一一对应关系。回归关系:不确定。例如血压和年龄的关系回归关系:不确定。例如血压和年龄的关系
3、。具有相同年龄的人,血压不一定相同。但在一定具有相同年龄的人,血压不一定相同。但在一定年龄范围内的人,其血压会在一定范围内波动。年龄范围内的人,其血压会在一定范围内波动。年龄与血压之间有一定的趋势。年龄与血压之间有一定的趋势。相关相关-变量间的互依关系变量间的互依关系直线相关直线相关(linear correlation)也叫简单相关也叫简单相关(simple correlation),用于双变量正态分布资,用于双变量正态分布资料。料。为判断两事物数量间有无相关,可先将两组变量为判断两事物数量间有无相关,可先将两组变量中一对对数值在普通方格纸上作散点图中一对对数值在普通方格纸上作散点图1.Po
4、sitive correlation,2.Perfect positive correlation,3.Negative correlation,4.Perfect negative correlation,5.6.7.Zero correlation,8.Non-linear correlation一、直线相关系数一、直线相关系数相关分析是用相关系数(相关分析是用相关系数(r)来表示两个变量间相)来表示两个变量间相互的直线关系,并判断其密切程度的统计方法。互的直线关系,并判断其密切程度的统计方法。又称积差相关系数(又称积差相关系数(coefficient of productmoment c
5、orrelation),或),或 Pearson 相相关系数(软件中常用此名称)说明相关的密切程关系数(软件中常用此名称)说明相关的密切程度和方向的指标。度和方向的指标。r-样本相关系数样本相关系数 -总体相关系数总体相关系数相关系数:说明具有直线关系的两变量间,相关系数:说明具有直线关系的两变量间,相关相关方向与密切程度方向与密切程度的统计指标。的统计指标。相关系数相关系数 r 没有单位,在没有单位,在-1+1范围变动,范围变动,符号符号表示相关的方向,大小表示相关的程度。表示相关的方向,大小表示相关的程度。r 0,正相关;,正相关;rr0。椭圆范围内各点的排列愈接近其长轴,相关愈密椭圆范围
6、内各点的排列愈接近其长轴,相关愈密切,当所有点都在长轴上时,切,当所有点都在长轴上时,r=1(见图(见图2),称),称为完全正相关。为完全正相关。负相关负相关见图见图3,各点分布亦呈椭圆形,各点分布亦呈椭圆形,Y随随X的的增加而减少,增加而减少,X也随也随Y的增加而减少的增加而减少,此时,此时0r-1。各点排列愈接近其长轴,相关愈密切,当所。各点排列愈接近其长轴,相关愈密切,当所有点都在长轴上时,有点都在长轴上时,r=1(见图(见图4),称为完全负),称为完全负相关。相关。生物现象中,完全正相关或完全负相关甚为少见。生物现象中,完全正相关或完全负相关甚为少见。无相关无相关见图见图5、6和和7,
7、X不论增加或减少,不论增加或减少,Y的的大小不受其影响;反之亦然。此时大小不受其影响;反之亦然。此时r=0。另外,。另外,须注意有时须注意有时虽然各点密集于一条直线,但该直线虽然各点密集于一条直线,但该直线与与X轴或轴或Y轴平行,即轴平行,即X与与Y的消长互不影响的消长互不影响,这,这种情况仍为无相关。种情况仍为无相关。非线性相关非线性相关见图见图8,图中各点的排列不呈直线,图中各点的排列不呈直线趋势,呈某种曲线形状,此时趋势,呈某种曲线形状,此时r0,称为,称为非线性非线性相关相关。|r|=0.7,高度相关;高度相关;0.4=|r|0.7,中度相关;中度相关;|r|0.05P0.05,就,就
8、接受假设,认为此接受假设,认为此r r很可能是从此总体中取得的。很可能是从此总体中取得的。因此判断两变量间无显著关系;因此判断两变量间无显著关系;如果取得如果取得r r值的概率值的概率P0.05P0.05或或P0.01P0.01,就在,就在=0.05=0.05或或=0.01=0.01水准上拒绝检验假设,认为该水准上拒绝检验假设,认为该r r不是来自不是来自=0=0的总体,而来自的总体,而来自00的另一个总的另一个总体,因此判断两变量间有显著关系。体,因此判断两变量间有显著关系。1 1建立检验假设,建立检验假设,H H0 0:=0=0,H H1 1:00,=0.05=0.052 2计算相关系数的
9、计算相关系数的r r的的t t值:值:2202112rrr ntrrn20.9070 1527.7651(0.9070)rt 3 3查查t t值表作结论值表作结论=n-2=15-2=13=n-2=15-2=13根据专业知识知道凝血酶浓度与凝血时间之根据专业知识知道凝血酶浓度与凝血时间之间不会呈正相关,故宜用单侧界限,查间不会呈正相关,故宜用单侧界限,查t t值表得值表得t t0.01,130.01,13=2.650=2.650今今t tr rtt0.01,130.01,13,P0.01P|r|r|-P P -相关不显著;相关不显著;r,|r|r|-PP-在在水准上相关显著;水准上相关显著;今:
10、今:r=-0.9070 r=-0.9070,=15-2=13=15-2=13,查附表界值,查附表界值,得:得:r r0.05,130.05,13=0.441 r=0.441 r0.01,130.01,13=0.592=0.592 现现rrrr0.01,130.01,13,P0.01,P0,Y随随X的的增大增大而而增大(减少增大(减少而而减少)减少)斜上斜上;b0,Y随随X的的增大增大而而减小(减少减小(减少而而增加)增加)斜下斜下;b=0,Y与与X无直线关系无直线关系 水平水平。b越大,表示越大,表示Y随随X变化越快,直线越陡峭。变化越快,直线越陡峭。最小二乘法原则最小二乘法原则(least
11、squares(least squares method)method):使各散点到:使各散点到直线的纵向距离的平方和最小。即:直线的纵向距离的平方和最小。即:最小。最小。2YYXXXYllnXXnYXXYXXYYXXb/)()(222XbYa根据前面的相关分析以及医学上有关凝血的机理,根据前面的相关分析以及医学上有关凝血的机理,可知凝血时间依凝血酶浓度而异,且有密切的关可知凝血时间依凝血酶浓度而异,且有密切的关系。因此可进一步作由凝血酶浓度(系。因此可进一步作由凝血酶浓度(X X)推算凝)推算凝血时间(血时间(Y Y)的回归方程。步骤如下:)的回归方程。步骤如下:1 1列回归计算表,计算列回
12、归计算表,计算X X、YY、XX2 2、YY2 2、XYXY。2 2计算计算 、(X-X)(X-X)2 2、(X(XX)(Y-Y)X)(Y-Y)=X/n=15.1/15=1.01=X/n=15.1/15=1.01 =Y/n=222/15=14.80=Y/n=222/15=14.80(X-)(X-)2 2=X=X2 2-(X)-(X)2 2/n=0.2093/n=0.2093(X-)(Y-)=XY-X(X-)(Y-)=XY-XY/n=-1.7800Y/n=-1.7800XXYYXXY3 3计算回归系数计算回归系数b b和截距和截距a a。本例本例b=-1.7800/0.2093=-8.5045b
展开阅读全文