线性回归和相关课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《线性回归和相关课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 线性 回归 相关 课件
- 资源描述:
-
1、第六章 直线相关与回归医学统计学及其软件包上海第二医科大学生物统计教研室 分析两个变量间的关系常用回归及相关分析的统计方法。 如两个变量间的关系是线性的,可用直线相关与回归分析;如两个变量间的关系是非线性的需用非线性(曲线)回归。 回归分析适用于分析变量间的因果关系;用一个自变量的值来估计另一个应变量的值。 相关分析用于分析两变量间相互联系的密切程度及相关方向。 第一节 概述 第二节 相关系数 相关分析的目的在于通过相关系数r来描述和度量两变量线性联系的程度和方向。 r0 正相关 图例1 r0 负相关 图例2 r=0 零相关 图例3 零相关即两变量间无关。 样本相关系数不等于零,并不表示总体相
2、关系数不等于零,还要作显著性检验。next2.52.72.93.13.33.53.74045505560r=0.7495回2.52.62.72.82.933.13.2404550556065r=-0.83597回 相关系数的计算: xxx22yyxxyyxxrnyxxyyyxxX和Y的离均差积和nxxxx222X的离均差平方和 相关系数的显著性检验 0:0:10HH212nrsr2ndfsrtrr样本相关系数的标准误查t界值表,得P值 例6.1 极谱法和碘量法测定水中溶解氧的含量,两法的测得值是否有相关性? 63.32)(211xx01.93)(222xx95.54)(2211xxxx9975
3、. 0r82.46rt11df01. 0P两法的测得值有相关(P0.01) 第三节 直线回归方程目的:找出描述x与y依存关系的直线方程。bxayY为应变量(dependent variable)X为自变量(independent variable)A为截距(intercept)b为回归系数(regression coefficient) 回归系数b表示x每改变一个单位,y平均改变b个单位。 Y=10 x+5 =4.22+0.20 x体重心脏横径y 设有n对x,y的观察值,先在直角坐标系中作散点图,如果散点的分布呈直线趋势,则可设法求出直线方程。 通常用最小二乘法,依据:各点与该直线的纵向距离的
4、平方和为最小 先由(6.3)式求得b,再由(6.4)式求得a,就得出直线回归程。 )(/)(2xxyyxxbxbyaxybxayiiyy2) (yy最小2) (yy2) (yy2) (yy回归系数的显著性检验 从样本资料中算得的回归系数b,也有抽样误差,因此需作显著性检验,检验其是否是回归系数为零的总体中抽得的。 H0:=0 H1:0。 当拒绝H0时,可认为x与y间的直线回归方程有统计学意义。 显著性检验可有两种方法:t 检验法和方差分析法。 t 检验法:bbsbt/2 ndf2.)(/xxssxyb样本回归系数的标准误)2/() (2.nyysyx剩余标准差2) (yy估计误差平方和2222
5、)(/)()() (xxyyxxyyyy方差分析法:Y的总变异X和Y的线性关系引起的变异误差引起的变异222) ()()(yyyyyy2)(yyU回归平方和2) (yyQ2) (yyQ误差平方和总的自由度:n-1 (总例数减1)回归自由度:1 (自变量个数)误差自由度:n-2 (总的自由度减去回归自由度)误差均方回归均方/F)2/(1/nQUFdf1=1, df2=n-2 查方差分析用的F界值表,得P值例6.2 研究正常男性年龄与运动后最大心率的关系,求直线回归方程。 xy2496. 32684.30201. 0,12,4078. 5Pdftb1,5954.24041dfU12,4046.98
6、72dfQ01. 0,2232.29PF直线回归相关分析的注意事项: 1. 相关分析只是以相关系数来描述两个变量间线性相关的程度和方向,并不阐明事物间存在联系的本质,也不是两事物间存在联系的证据。要阐明两事物间的本质联系,必须凭专业知识从理论上加以论证。因此,把两个毫无关系的事物放在一起作相关分析是毫无意义的。同样,作回归分析也要有实际意义。 直线回归相关分析的注意事项:2. 在进行直线回归前应绘制散点图,有直线趋势时,才适宜作直线回归分析。散点图还能提示资料有无异常点。3. 直线回归方程的适用范围一般以自变量的取值范围为限。直线回归相关分析的注意事项: 4. 对同一组资料作回归和相关分析,其
7、相关系数和回归系数的显著性检验结果完全相同。由于相关系数的显著性检验结果可直接查表,比较方便;而回归系数的显著性检验计算复杂,故在实际应用中常用相关系数的显著性检验结果代替回归系数的显著性检验。直线回归相关分析的注意事项:5. 在资料要求上: 相关分析要求两个变量服从双变量正态分布。 回归分析要求因变量服从正态分布,自变量可以是精确测量和严格控制的变量。如两个变量服从双变量正态分布,则可以作两个回归方程,用X推算Y,或用Y推算X。 第五节 过定点的直线回归 医学研究中在拟合直线时,除了要求与观察点尽量接近外,还常常要求必须经过某定点(m,n)。例如在光电比色、荧光分析、火焰光度测定以及同位素测
8、定等实验方法绘制标准直线时就常有这样的要求。 此定点也可以是(m,0),(0,n)或(0,0)等,尤以(0,0)为最常见。 计算公式和实例见第116页。第六节 直线相关与回归的SAS程序 SAS的CORR过程可用于求变量之间的线性相关系数及偏相关系数。; SAS的REG过程可用于各种线性回归分析,包括多元回归(见第七章),逐步回归和最优子集回归(见第八章)等。第七章 多元回归及相关第一节 多元线性回归的基本概念 事物间的相互联系往往是多方面的,在很多情况下对应变量y 发生影响的自变量往往不止一个 。多元线性回归的目的就是用一个多元线性回归方程表示多个自变量和1个应变量间的关系。mmiixbxb
展开阅读全文