书签 分享 收藏 举报 版权申诉 / 98
上传文档赚钱

类型医学统计学九双变量回归与相关课件.ppt

  • 上传人(卖家):晟晟文业
  • 文档编号:5157179
  • 上传时间:2023-02-15
  • 格式:PPT
  • 页数:98
  • 大小:1.95MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《医学统计学九双变量回归与相关课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    医学 统计学 变量 回归 相关 课件
    资源描述:

    1、2023-1-12医学统计学1 Bivariate Regression&Correlation2023-1-12医学统计学2 讲课内容:讲课内容:2023-1-12医学统计学3 p第第2、第第3、第第4章介绍了计量资料章介绍了计量资料单变量单变量的统的统 计描述与统计推断:计描述与统计推断:lP.13 例例2-1:计算计算101名成年女子名成年女子血清总胆固血清总胆固 醇醇的平均指标与变异指标。的平均指标与变异指标。lP.51 例例3-7:比较阿卡波糖胶囊比较阿卡波糖胶囊(试验组试验组)与拜与拜 糖苹胶囊糖苹胶囊(对照组对照组)降低糖尿病人的降低糖尿病人的空腹血糖值空腹血糖值 有无差别。有无

    2、差别。lP.73 例例4-2:比较安慰剂组、降血脂新药比较安慰剂组、降血脂新药2.4g 组、降血脂新药组、降血脂新药4.8g组、降血脂新药组、降血脂新药7.2g组降组降 低患者的低患者的低密度脂蛋白含量低密度脂蛋白含量有无差别。有无差别。2023-1-12医学统计学4p在医学研究中常要分析在医学研究中常要分析两变量两变量间或间或多变多变 量间量间的关系:的关系:l 年龄与血压年龄与血压l 药物剂量与动物死亡率药物剂量与动物死亡率l 肺活量与身高、体重、胸围和肩宽等肺活量与身高、体重、胸围和肩宽等 2023-1-12医学统计学5p事物间的相关关系事物间的相关关系l确定性关系确定性关系 两变量间的

    3、函数表达式两变量间的函数表达式 圆的周长与半径的关系:圆的周长与半径的关系:C2 R 路程与速度、时间的关系:路程与速度、时间的关系:LST 数学中数学中X与与Y的直线函数关系:的直线函数关系:Ya+bX l非确定性关系非确定性关系 两变量间存在关系,但未精两变量间存在关系,但未精 确到可以用函数表达式来描述。确到可以用函数表达式来描述。年龄与血脂的关系;年龄与血脂的关系;身高与体重的关系;身高与体重的关系;体重与体表面积的关系。体重与体表面积的关系。2023-1-12医学统计学6Linear Regression2023-1-12医学统计学7一、直线回归的概念一、直线回归的概念“回归回归”是

    4、一个借用已久因而相沿成习是一个借用已久因而相沿成习 的统计学术语。的统计学术语。直线回归是分析直线回归是分析成对观测数据成对观测数据中两变量中两变量 间间线性依存关系线性依存关系的方法。的方法。2023-1-12医学统计学8p生物遗传学上的生物遗传学上的“回归回归”Pearson K(英英,18571936)1903年搜集了年搜集了1078个家庭人员的身高、前臂长等指标的记录,个家庭人员的身高、前臂长等指标的记录,发现儿子身高发现儿子身高(Y,英寸英寸)与父亲身高间与父亲身高间(X,英寸英寸)存在线性依存关系:存在线性依存关系:=33.73+0.516 X 但不少身材高的父亲的儿子成年后身高比

    5、其但不少身材高的父亲的儿子成年后身高比其父亲矮,不少身材矮的父亲的儿子成年后身父亲矮,不少身材矮的父亲的儿子成年后身高比其父亲高。高比其父亲高。Galton F(英英,18221911)将这种现象称之为将这种现象称之为子一代身高向人群平均身高的子一代身高向人群平均身高的“回归回归”。Y2023-1-12医学统计学9210=10242023-1-12医学统计学10Francis GaltonFrancis Galton 爵士爵士(英英,18221911)是达是达尔文尔文(Charles Darwin)的表弟。他对统计学的表弟。他对统计学的主要贡献是提出的主要贡献是提出“相关相关”与与“回归回归”

    6、的概念,用统计方法的概念,用统计方法对进化论中的变异进对进化论中的变异进行研究,开创了生物行研究,开创了生物统计学。统计学。2023-1-12医学统计学11Karl PearsonKarl Pearson(英英,18571936)是是Francis Galton 的得的得意门生,他开创了统意门生,他开创了统计方法学。他对统计计方法学。他对统计学的主要贡献:变异学的主要贡献:变异数据的处理、分布曲数据的处理、分布曲线的选配、卡方检验线的选配、卡方检验的提出、回归与相关的提出、回归与相关的发展。的发展。2023-1-12医学统计学12p天文学上的天文学上的“回归回归”地球绕太阳公转,在公转的同时本

    7、身还自转,地球绕太阳公转,在公转的同时本身还自转,在本身自转的同时地球的假设轴心还来回摆在本身自转的同时地球的假设轴心还来回摆动。由于地球轴心的来回摆动,太阳光垂直动。由于地球轴心的来回摆动,太阳光垂直照射到地球上就有南、北两个极限位置照射到地球上就有南、北两个极限位置(南、南、北纬北纬23027),分别称南、北回归线,太阳光分别称南、北回归线,太阳光对赤道对赤道“回归回归”垂直照射到南、北回归线的垂直照射到南、北回归线的时间分别为我国农历的冬至与夏至。时间分别为我国农历的冬至与夏至。2023-1-12医学统计学13p日常生活中的日常生活中的“回归回归”现象现象 1岁姜二狗,岁姜二狗,7岁姜二

    8、狗同学,岁姜二狗同学,20岁小姜同志,岁小姜同志,30岁姜科长,岁姜科长,40岁姜处长,岁姜处长,50岁姜局长,岁姜局长,60岁姜老,岁姜老,70岁老姜,岁老姜,80岁姜二狗。岁姜二狗。p目前目前“回归回归”已成为表示变量之间已成为表示变量之间数量依数量依存关系存关系的统计术语,并且衍生出的统计术语,并且衍生出“回归方回归方程程”、“回归系数回归系数”等统计学概念。等统计学概念。2023-1-12医学统计学14例例 某地方病研究所调查了某地方病研究所调查了8名正常儿童的尿名正常儿童的尿肌酐含量肌酐含量(mmol/24h),试估计尿肌酐含量试估计尿肌酐含量(Y)对其年龄对其年龄(X)的回归方程。

    9、的回归方程。2023-1-12医学统计学158名儿童的年龄与其尿肌酐含量名儿童的年龄与其尿肌酐含量2.42.62.833.23.43.6468101214年龄(岁)年龄(岁)X尿肌酐含量尿肌酐含量bXaY Y(mmol/24h)hat2023-1-12医学统计学16各散点呈直线趋势各散点呈直线趋势但并非均在一条直线上但并非均在一条直线上根据原始数据拟合的直线方程与数理根据原始数据拟合的直线方程与数理 上二元一次函数方程在内涵上有区别,上二元一次函数方程在内涵上有区别,称为称为直线回归方程直线回归方程。2023-1-12医学统计学17二、直线回归方程的求法二、直线回归方程的求法6617.15.9

    10、1392.09838.2XbYa1392.0428450.5n/)X(Xn/)Y)(X(XY)XX()YY)(XX(llb222XXXY 最小二乘法最小二乘法2)YY(在所有直线中最小在所有直线中最小2023-1-12医学统计学18CASIO fx-3600PV计算器计算计算器计算a、b与与r步骤步骤 键键 盘盘 说说 明明 1 MODE 2 进入线性回归模式进入线性回归模式 LR 2 SHIFT KAC 清除以前储存数据清除以前储存数据 3 13 XDYD 3.54 DATA 数据输入数据输入 11 XDYD 3.01 DATA 9 XDYD 3.09 DATA 4 SHIFT r 显示相关

    11、系数显示相关系数 0.8818 5 SHIFT a 显示截距显示截距 1.6617 6 SHIFT b 显示回归系数显示回归系数 0.1392 SHIFT DEL 删除输错的一对数据删除输错的一对数据2023-1-12医学统计学208名儿童的年龄与其尿肌酐含量名儿童的年龄与其尿肌酐含量2.42.62.833.23.43.6468101214年龄(岁)年龄(岁)X尿肌酐含量尿肌酐含量Y(mmol/24h)X1392.06617.1Y (8,2.8)(12,3.3)2023-1-12医学统计学21p b 的意义的意义斜率斜率(slope)X1392.06617.1Y 年龄每增加年龄每增加1岁岁,尿

    12、肌酐含量平均增加尿肌酐含量平均增加0.1392(mmol/24h)b的单位为的单位为(Y的单位的单位/X的单位的单位)2023-1-12医学统计学22bXa Y a 截距截距(intercept,constant)X=0 时,时,Y的估计值的估计值a的单位与的单位与Y值相同值相同当当X可能取可能取0时,时,a才有实际意义。才有实际意义。p a 的意义的意义2023-1-12医学统计学23回归直线的有关性质回归直线的有关性质直线通过均点直线通过均点 各点到该回归线纵向距离平方和较到其它任何各点到该回归线纵向距离平方和较到其它任何直线者为小。直线者为小。2)YY()Y,X(X XY bXaY 为来

    13、自为来自的一个样本的一个样本对于对于X各个取值,相各个取值,相应应Y的总体均数的总体均数2023-1-12医学统计学24的的一一个个样样本本为为来来自自 X bXaYXY XY2023-1-12医学统计学25三、直线回归方程中的统计推断三、直线回归方程中的统计推断(一)回归方程的假设检验(一)回归方程的假设检验1.1.方差分析方差分析(1 1)建立检验假设并确定检验水准)建立检验假设并确定检验水准 H0:=0 H1:0 =0.052)Y(Y 2)(的分解的分解重点重点2023-1-12医学统计学26因变量因变量Y总变异总变异 的分解的分解X Y Y)(YY )(YYY)(YY Y2)YY(20

    14、23-1-12医学统计学27)YY(YY(YY ))YY(YY(YY )222)YY)YY)YY (SS总总=SS回回+SS残残XXXYl/lb ,XbYa ,bXaY0)YY)(YY2 (222)YY()YY)(YY2YY()YY(()222)YY()YY)(YY2YY()YY(()2023-1-12医学统计学28未引进回归时的总变异:未引进回归时的总变异:(sum of squares of deviation from mean)引进回归以后的剩余变异引进回归以后的剩余变异:(sum of squares of residuals)回归的贡献,回归平方和:回归的贡献,回归平方和:(sum

    15、 of squares due to regression)2)YY(Y的总变异分解的总变异分解2)YY(2)YY(2023-1-12医学统计学29(3)计算检验统计量计算检验统计量F值值97.200388.08134.0MSMSv/SSv/SSF 残残回回残残残残回回回回SS总总=lYY=1.0462 SS回回=blXY=l2XY/lXX=5.8452/42=0.8134SS残残=SS总总SS回回=1.04620.8134=0.2328v总总=v回回+v剩剩v总总=n1,v回回=1,v残残=n22023-1-12医学统计学30F0.01(1,6)=13.742023-1-12医学统计学312

    16、.t 检验检验bS0bt XXX.YblSS 2n 2nSS2n)YY(S2XY 残残回归的剩余标准差回归的剩余标准差扣除了扣除了X的影响后的影响后Y方面的变异方面的变异;引进回归方程后引进回归方程后,Y方面的变异。方面的变异。2023-1-12医学统计学32(2)计算检验统计量)计算检验统计量 t 值值(1)建立检验假设并确定检验水准)建立检验假设并确定检验水准1970.0282328.0SX.Y 0304.0421970.0Sb 579.40304.01392.0t (3)确定)确定P值下结论值下结论 )(2/),1(t579.497.20F 0.005P 317.4t579.4t6,2/

    17、005.0 2023-1-12医学统计学33(二)总体回归系数(二)总体回归系数 的可信区间的可信区间),(0.2136 0648.00304.0447.21392.0Stbb6,2/05.0 此区间不包括此区间不包括=0,结论为,结论为b有统计学意义。有统计学意义。2023-1-12医学统计学34 SPSS结果结果A AN NO OV VA Ab b.8131.81320.968.004a.2336.0391.0467RegressionResidualTotalModel1Sum ofSquaresdfMean SquareFSig.Predictors:(Constant),年龄(岁)a

    18、.Dependent Variable:尿肌酐含量(mmol/L)b.C Co oe ef ff fi ic ci ie en nt ts sa a1.662.2975.595.001.9352.388.139.030.8824.579.004.065.214(Constant)年龄(岁)Model1BStd.ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.Lower BoundUpper Bound95%Confidence Interval for BDependent Variable:尿肌酐含量(mmol/

    19、L)a.2023-1-12医学统计学35(三)利用回归方程进行估计与预测(三)利用回归方程进行估计与预测1.总体均数总体均数 的可信区间的可信区间XY 220XYYY,2/0)XX()XX(n1SSStY00 XY:给定给定X后对应后对应Y的总体均数的总体均数:Y0给定给定X后对应后对应Y的样本均数的样本均数2023-1-12医学统计学360Y,2/0StY 2.个体个体Y值的容许区间值的容许区间220XYY)XX()XX(n11SS0 给定给定X后对应个体后对应个体Y值波动范围值波动范围2023-1-12医学统计学37 X Y (体重体重,kg)(体表面积体表面积,103cm2)11.0 5

    20、.28311.8 5.29912.0 5.35812.3 5.29213.15.60213.7 6.01414.4 5.83014.9 6.10215.2 6.07516.0 6.411例例 某地某地10名三岁儿童体重与体表面积名三岁儿童体重与体表面积2023-1-12医学统计学381112131415164.55.05.56.06.57.0可信区间可信区间与与容许区间容许区间示意示意(confidence band&tolerance band)X 体重体重Y 体体表表面面积积2023-1-12医学统计学39Linear Correlation2023-1-12医学统计学40p生物遗传学上的

    21、生物遗传学上的“相关相关”在回归分析中,有理由认为父亲身高决定儿在回归分析中,有理由认为父亲身高决定儿子身高,故把父亲身高作为自变量子身高,故把父亲身高作为自变量X,儿子身,儿子身高作为应变量高作为应变量Y。Pearson K(英英,18571936)在对同一家庭中兄在对同一家庭中兄弟与姐妹身高间关系进行分析时,发现两者弟与姐妹身高间关系进行分析时,发现两者难以象父亲与儿子身高间关系那样区别自变难以象父亲与儿子身高间关系那样区别自变量量X与应变量与应变量Y,也不必计算回归方程。,也不必计算回归方程。Galton F(英英,18221911)将这种现象称之为将这种现象称之为“相关相关”。2023

    22、-1-12医学统计学41u 当一个变量增大,另一个也随之增大当一个变量增大,另一个也随之增大(或减少或减少),我们称这种现象为共变,或,我们称这种现象为共变,或相关。相关。两个变量有共变现象,称为有相两个变量有共变现象,称为有相关关系关关系。u 相关关系不一定是因果关系。相关关系不一定是因果关系。一、直线相关的概念一、直线相关的概念2023-1-12医学统计学42r=0(h)r 0(f)r-1(d)r1(b)0r1(a)-1r0(c)r 0(e)r 0(g)零相关正相关负相关完全正相关完全负相关零相关零相关零相关相互关系示意图相互关系示意图2023-1-12医学统计学43相关系数的性质相关系数

    23、的性质u两变量间的线性关系密切程度与相关方两变量间的线性关系密切程度与相关方 向用直线相关系数向用直线相关系数r表示。表示。u1 r 1ur0为正相关为正相关ur0为负相关为负相关ur0为零相关或无相关为零相关或无相关2023-1-12医学统计学44YYXXXY22lll)YY()XX()YY)(XX(r 22)YY()YY()XX()XX(r YXsYYsXX1n1r二、相关系数的意义与计算二、相关系数的意义与计算 Pearson 相关系数相关系数 标准化后的协方差标准化后的协方差协协方方差差方方差差 1n)YY)(XX(1n)XX(2 2023-1-12医学统计学458818.01.046

    24、425.845 lll )YY()XX()YY)(XX(rYYXXXY22 2023-1-12医学统计学46SPSS结果结果C Co or rr re el la at ti io on ns s1.000.882.8821.000.002.002.8888尿肌酐含量(mmol/L)年龄(岁)尿肌酐含量(mmol/L)年龄(岁)尿肌酐含量(mmol/L)年龄(岁)Pearson CorrelationSig.(1-tailed)N尿肌酐含量(mmol/L)年龄(岁)2023-1-12医学统计学47三、相关系数的统计推断三、相关系数的统计推断(一)相关系数的假设检验(一)相关系数的假设检验 0:

    25、H0 尿肌酐含量与年龄之间无直线相关关系尿肌酐含量与年龄之间无直线相关关系 0.05 0:H1 2023-1-12医学统计学48附表附表20.005P 870.0r0.8818r0.005/2,6 附表附表130.005P 317.4t579.4t579.4288818.018818.02nr1rS0r 6,2/005.0r22r rtbt2023-1-12医学统计学49(二)总体相关系数的可信区间(二)总体相关系数的可信区间相关系数的抽样分布在相关系数的抽样分布在 0时呈偏态分布时呈偏态分布1e1er 3nuZZ22Z2/Z的的1-可信区间:可信区间:变换后变换后r的的1-可信区间:可信区间

    26、:)r1()r1(ln21Z Z变换后服从正态分布变换后服从正态分布2023-1-12医学统计学50-0.8-0.6-0.4-0.2 0.00100200300-1.0 00.20.40.60.81.00100200300 =-0.8 =0.82023-1-12医学统计学51R.A.Fisher(1921)的的 z 变换变换1e1err1r1ln21zz2z2 z 近似服从均数为近似服从均数为 ,标准差为标准差为 的正态分布。的正态分布。)1/()1(ln21rr3/1n2023-1-12医学统计学52相关系数的相关系数的z变换值的抽样分布变换值的抽样分布(=-0.8)00.51.01.52.

    27、0050100150200-0.8-0.6-0.4-0.2 0.00100200300-1.0变换前变换前变换后变换后2023-1-12医学统计学53 01234050100150200 00.20.40.60.81.00100200300相关系数的相关系数的z变换值的抽样分布变换值的抽样分布(=0.8)变换前变换前变换后变换后2023-1-12医学统计学54相关系数的可信区间估计相关系数的可信区间估计1.将将 r 变换为变换为 z。2.根据根据 z 服从正态分布,估计服从正态分布,估计 z 的可信区间。的可信区间。3n1uzsuzz 1e1erz2z2 3.再将再将 z 变换回变换回 r。2

    28、023-1-12医学统计学55p求得求得8名健康成人血清总胆固醇与低密度脂名健康成人血清总胆固醇与低密度脂蛋白胆固醇含量间的蛋白胆固醇含量间的 r=0.974,试求总体相关,试求总体相关系数系数 的的95%可信区间。可信区间。1649.2974.01974.01ln21r1r1ln21Z z的的95%可信区间:可信区间:0414.32883.138/96.11649.23n/uZ2/05.0 总体相关系数总体相关系数的的95%可信区间可信区间:(0.8587 0.9954)2023-1-12医学统计学56四、决定系数四、决定系数7775.08818.0ll/lSSSSR2YYXX2XY2 )(

    29、总总回回 0R21 Y的总变异中回归关系所能解释的百分比的总变异中回归关系所能解释的百分比 年龄可解释尿肌酐含量变异性的年龄可解释尿肌酐含量变异性的77.75%2023-1-12医学统计学57五、直线回归与直线相关的区别与联系五、直线回归与直线相关的区别与联系p 区别区别 ur没有单位,没有单位,b有单位;有单位;u相关表示相互关系,没有依存关系;相关表示相互关系,没有依存关系;回归有依存关系;回归有依存关系;u对资料的要求不同:对资料的要求不同:当当X和和Y都是随机的,可以进行相关和回都是随机的,可以进行相关和回 归分析;归分析;当当Y是随机变量,是随机变量,X是控制变量时,理论是控制变量时

    30、,理论 上只能作回归而不能作相关分析;上只能作回归而不能作相关分析;2023-1-12医学统计学58p 区别区别 uI型回归:型回归:Y是随机变量,是随机变量,X是控制变量;是控制变量;II型回归:型回归:Y与与X均是随机变量。均是随机变量。u同一资料中由同一资料中由X推算推算Y与由与由Y推算推算X的回归的回归方程不同:方程不同:YbaXXbaYY.XY.XX.YX.Y 2023-1-12医学统计学59p 联系联系u均表示线性关系均表示线性关系u符号相同:共变方向一致符号相同:共变方向一致u假设检验结果相同:假设检验结果相同:tr=tbyyxxxyxxxylllr llb 总总回回SSSSr

    31、bbr llrb2y.xx.yxxyy u 可以互相换算:可以互相换算:2023-1-12医学统计学60六、直线回归与相关应用的注意事项六、直线回归与相关应用的注意事项u相关:相关:X与与Y没有主次,为双向。没有主次,为双向。u回归:回归:Y依依X变化而变化,为单向。变化而变化,为单向。u自变量的选择:自变量的选择:原因、容易测量、变异小原因、容易测量、变异小u要有实际意义。要有实际意义。1.根据分析目的选择变量及统计方法根据分析目的选择变量及统计方法2023-1-12医学统计学61孩子的身高与小树孩子的身高与小树的高度间显示出显的高度间显示出显著的相关性著的相关性10010410210610

    32、8孩子的身高(c m)小树的高度(c m)140 150 160 170 180 1902023-1-12医学统计学62u有无异常点,谨慎剔除。有无异常点,谨慎剔除。2.进行相关、回归分析前要绘制散点图,进行相关、回归分析前要绘制散点图,进行判断进行判断2023-1-12医学统计学63离群值对相关的影响离群值对相关的影响2023-1-12医学统计学64样本的间杂性对相关性的误导样本的间杂性对相关性的误导2023-1-12医学统计学653.用残差图考察数据是否符合模型假设条件用残差图考察数据是否符合模型假设条件 iiiYYe Y与与X为线形关系为线形关系误差服从均数为误差服从均数为0的正态分布的

    33、正态分布方差相等方差相等各观察单位独立各观察单位独立u回归模型应用前提条件:回归模型应用前提条件:2023-1-12医学统计学66e0Y2023-1-12医学统计学670000eeeeYYYY2023-1-12医学统计学68uP值越小越有理由认为变量间直线关系值越小越有理由认为变量间直线关系 存在,不能说关系越密切。存在,不能说关系越密切。u直线回归关系可以内插,不宜外延。直线回归关系可以内插,不宜外延。u当样本含量较大时,统计学检验的作用当样本含量较大时,统计学检验的作用 减弱。减弱。r0.05/2,100=0.1954.结果的解释及正确应用结果的解释及正确应用2023-1-12医学统计学6

    34、9Rank Correlation 2023-1-12医学统计学70p应用条件:应用条件:1.不服从双变量正态分布而不宜作积差不服从双变量正态分布而不宜作积差 相关分析;相关分析;2.总体分布类型未知;总体分布类型未知;3.原始数据用等级表示。原始数据用等级表示。2023-1-12医学统计学71表表93 某某省省 1995年年到到1999年年居居民民死死因因构构成成与与WYPLL构构成成 死死 因因 类类 别别 死死因因构构成成(%)WYPLL构构 成成(%)d d2 PQ(1)X(2)P(3)Y(4)Q(5)(6)=(3)-(5)(7)=(6)2 (8)=(3)(5)1 0.03 1 0.0

    35、5 1 0 0 1 2 0.14 2 0.34 2 0 0 4 3 0.20 3 0.93 6-3 9 18 4 0.43 4 0.69 4 0 0 16 5 0.44 5 0.38 3 2 4 15 6 0.45 6 0.79 5 1 1 30 7 0.47 7 1.19 8-1 1 56 8 0.65 8 4.74 12-4 16 96 9 0.95 9 2.31 9 0 0 81 10 0.96 10 5.95 14-4 16 140 11 2.44 11 1.11 7 4 16 77 12 2.69 12 3.53 11 1 1 132 13 3.07 13 3.48 10 3 9 1

    36、30 14 7.78 14 5.65 13 1 1 182 15 9.82 15 33.95 18-3 9 270 16 18.93 16 17.16 17-1 1 272 17 22.59 17 8.42 15 2 4 255 18 27.96 18 9.33 16 2 4 288 合合 计计 171 171 92 2063 work years of potential life lost2023-1-12医学统计学72表表93 某某省省 1995年年到到1999年年居居民民死死因因构构成成与与WYPLL构构成成 死死因因类类别别 死死因因构构成成(%)WYPLL构构成成(%)d d2 P

    37、Q(1)X(2)P(3)Y(4)Q(5)(6)=(3)-(5)(7)=(6)2 (8)=(3)(5)1 0.03 1 0.05 1 0 0 1 2 0.14 2 0.34 2 0 0 4 3 0.20 3 0.93 6-3 9 18 4 0.43 4 0.69 4 0 0 16 5 0.44 5 0.38 3 2 4 15 6 0.45 6 0.79 5 1 1 30 7 0.47 7 1.19 8-1 1 56 8 0.65 8 4.74 12-4 16 96 9 0.95 9 2.31 9 0 0 81 10 0.96 10 5.95 14-4 16 140 11 2.44 11 1.11

    38、 7 4 16 77 12 2.69 12 3.53 11 1 1 132 13 3.07 13 3.48 10 3 9 130 14 7.78 14 5.65 13 1 1 182 15 9.82 15 33.95 18-3 9 270 16 18.93 16 17.16 17-1 1 272 17 22.59 17 8.42 15 2 4 255 18 27.96 18 9.33 16 2 4 288 合合 计计 171 171 92 2063 2023-1-12医学统计学730.001P 728.0rr905.018189261)1n(nd61r05.0 0:H 0:H18n0.001,

    39、SS32SS1S0 或用秩或用秩Pi、Qi直接计算积差相关系数直接计算积差相关系数r附表附表14(n50)2023-1-12医学统计学74SPSS结果结果C Co or rr re el la at ti io on ns s1.000.905*.0001818.905*1.000.000.1818Correlation CoefficientSig.(2-tailed)NCorrelation CoefficientSig.(2-tailed)N死因构成(%)WYPLL构成(%)Spearmans rho死因构成(%)WYPLL构成(%)Correlation is significant

    40、at the 0.01 level(2-tailed).*.D De es sc cr ri ip pt ti iv ve e S St ta at ti is st ti ic cs s5.55568.66889185.55568.3102818死因构成(%)WYPLL构成(%)MeanStd.DeviationN2023-1-12医学统计学752023-1-12医学统计学762023-1-12医学统计学77YXbcb2b1bc02023-1-12医学统计学782023-1-12医学统计学79一、曲线拟合的一般步骤一、曲线拟合的一般步骤 1.依据分析目的确定依据分析目的确定X与与Y,根据两变

    41、量,根据两变量 散点图、结合专业知识选择曲线类型。散点图、结合专业知识选择曲线类型。2.求回归方程:曲线直线化。求回归方程:曲线直线化。3.拟合优度:拟合优度:R2。2023-1-12医学统计学80CRF:促肾上腺皮质激素释放因子促肾上腺皮质激素释放因子 ACTH:肾上腺皮质激素肾上腺皮质激素例例9-132023-1-12医学统计学812060100140180-100102030 例例9-13数据散点图数据散点图CRF(nmol/L)XYACTH(pmol/L)2023-1-12医学统计学822023-1-12医学统计学83 例例9-13数据对数据对X作对数变换散点图作对数变换散点图2060

    42、100140180-3-2-1012YACTH(pmol/L)lg CRF(nmol/L)X98.0RXlg 171.3611.110Y2 2023-1-12医学统计学84例例9-142023-1-12医学统计学85 例例9-14数据散点图数据散点图病人住院天数(天)病人住院天数(天)XY预后指数预后指数2023-1-12医学统计学8600.511.522.533.544.5010203040506070lnY预预后后指指数数 例例9-14数据对数据对Y作对数变换散点图作对数变换散点图病人住院天数(天)病人住院天数(天)XX038.0e66.56YX038.0037.4Yln 2023-1-1

    43、2医学统计学87bXa)bXa(eeeYbXaYlnY 用最小二乘估计只能保证用最小二乘估计只能保证 最小最小2 YY)(不能保证将变换值方程不能保证将变换值方程 回代回代后得到的后得到的 最小。最小。2YY)()bXa(eY 2023-1-12医学统计学88 二、曲线拟合的用途二、曲线拟合的用途 1.定量刻画定量刻画X与与Y的关系。的关系。2.用决定系数用决定系数R2反应两变量曲线关系的密反应两变量曲线关系的密切程度。切程度。2023-1-12医学统计学89YX0XlgbaY 三、常见的几种曲线三、常见的几种曲线对数曲线对数曲线2023-1-12医学统计学90YX0)bXa(eY 指数曲线指

    44、数曲线2023-1-12医学统计学91YX0Y=b0+b1 X+b2 X2 抛物线抛物线2023-1-12医学统计学92YXY=b0+b1 X+b2 X2+b3 X3 03次多项式曲线次多项式曲线2023-1-12医学统计学9333221010 X)b(bX10221010XbXbXbbY Cubic.6XlnbbY cLogarithmi.5eY Growth.4b bY Compound.3XbXbbY c2.Quadrati XbbY Linear.110 三次模型三次模型对数模型对数模型生长模型生长模型复合模型复合模型二次模型二次模型线性模型线性模型SPSS中曲线模型中曲线模型2023

    45、-1-12医学统计学94bXa b010 Xb0 X)/b(be11Y Logistic Logistic.11 XbY Power.10X/bbY Inverse.9e bY lExponentia.8eY S S .71110 模模型型幂幂模模型型逆逆模模型型指指数数模模型型型型模模型型Model Summary and Parameter EstimatesModel Summary and Parameter EstimatesDependent Variable:ACTH(pmol/L).980148.08613.001110.06015.685.989278.18113.00097

    46、.567.186EquationLogarithmicPowerR SquareFdf1df2Sig.Model SummaryConstantb1Parameter EstimatesThe independent variable is CRF(nmol/L).例例9-13M Mo od de el l S Su um mm ma ar ry y a an nd d P Pa ar ra am me et te er r E Es st ti im ma at te es sDependent Variable:预后指数.886100.617113.00046.460-.753.96536

    47、2.458113.00072.283-15.966.64223.273113.00014.221106.305.982321.054212.00055.822-1.710.015.989317.970311.00059.225-2.366.040.000.955276.379113.00056.665.963.82963.174113.000159.930-.719.43710.088113.0072.5054.263.955276.379113.0004.037-.038.955276.379113.00056.665-.038.955276.379113.000.0181.039EquationLinearLogarithmicInverseQuadraticCubicCompoundPowerSGrowthExponentialLogisticR SquareFdf1df2Sig.Model SummaryConstantb1b2b3Parameter EstimatesThe independent variable is 住院天数.例例9-142023-1-12医学统计学97 讲课内容:讲课内容:2023-1-12医学统计学98Thank you!

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:医学统计学九双变量回归与相关课件.ppt
    链接地址:https://www.163wenku.com/p-5157179.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库