医学统计学第十六章-Logistic回归分析-课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《医学统计学第十六章-Logistic回归分析-课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 统计学 第十六 Logistic 回归 分析 课件
- 资源描述:
-
1、2023-2-161 第十六章第十六章 logistic回归分析回归分析2023-2-162ContentnLogistic regression nConditional logistic regression nApplication 2023-2-163讲述内容讲述内容:第一节第一节 logisticlogistic回归回归第二节第二节 条件条件logisticlogistic回归回归第三节第三节 logisticlogistic回归的应用回归的应用 及其注意事项及其注意事项2023-2-164目的:目的:作出以多个自变量(危险因素)估计作出以多个自变量(危险因素)估计应变量(应变量(结
2、果因素)结果因素)的的logistic回归方程。回归方程。属于概率型非线性回归。属于概率型非线性回归。资料:资料:1.应变量为反映某现象发生与不发生的应变量为反映某现象发生与不发生的二值变量;二值变量;2.自变量宜全部或大部分为分类自变量宜全部或大部分为分类变量,可有少数数值变量。分类变量要数量变量,可有少数数值变量。分类变量要数量化。化。2023-2-165用途:用途:研究某种疾病或现象发生和多个危研究某种疾病或现象发生和多个危 险因素(或保护因子)的数量关系。险因素(或保护因子)的数量关系。用用 检验(或检验(或u检验)的检验)的局限性局限性:1.只能研究只能研究1个危险因素;个危险因素;
3、2.只能得出定性结论。只能得出定性结论。22023-2-166 种类种类:1.成组(非条件)成组(非条件)logistic回归方程。回归方程。2.配对(条件)配对(条件)logistic回归方程。回归方程。2023-2-167第一节第一节 logistic回归回归(非条件(非条件logistic回归回归)2023-2-168 一、基本概念一、基本概念1 0 Y发生应变量未发生12,mXXX自变量,在m个自变量的作用下阳性结果发生的概率记作个自变量的作用下阳性结果发生的概率记作:),|1(21mXXXYPP1P02023-2-16911ZPe若令若令:mmXXXZ2211001122ln=1mm
4、PXXXP0112211 exp()mmPXXX回回归归模模型型其中0为常数项,m,21为回归系数。概率概率P:01,logitP:。取值范围取值范围 logitP2023-2-1610图图16-1 logistic函数的图形函数的图形00.51-4-3-2-10123410.5PZ:,0,:0,0.5,1PZ2023-2-1611模模型型参参数数的的意意义义01122ln=logit1mmPXXXPP常数项常数项 表示暴露剂量为表示暴露剂量为0时个体发病时个体发病与不发病概率之比的自然对数。与不发病概率之比的自然对数。回归系数回归系数 表示自变量表示自变量 改变一个单位时改变一个单位时log
5、itP 的改变量。的改变量。0),2,1(mjjjX2023-2-1612流行病学衡量危险因素作用大小的流行病学衡量危险因素作用大小的比数比例比数比例指标。指标。计算公式为:计算公式为:1100/(1)/(1)jPPORPP优势比优势比OR(odds ratio)2023-2-1613111000010010/(1)lnlnlogitlogit/(1)()()()jmmjttjtttjtjjPPORPPPPcXcXcc对对比比某某一一危危险险因因素素两两个个不不同同暴暴露露水水平平1cXj与与0cXj的的发发病病情情况况(假假定定其其它它因因素素的的水水平平相相同同),其其优优势势比比的的自自
6、然然对对数数为为:与与 logisticP 的关系的关系:2023-2-16140,1 exp,0,1 0,1 jjjjjjOROROROR无作用危险因保子护因子则有101 ,1,0 jccX暴非若暴露露由于jOR值与模型中的常数项0无关,0在危险因素分析中通常视其为无效参数。1100/(1)1,/(1)PPPORRRPP当则有10 exp()jjORcc即2023-2-1615 11(1)iinYYiiiLPP 1lnln(1)ln(1)niiiiiLYPYP mbbbb,210 二、logistic回归模型的参数估计回归模型的参数估计 1.参数估计参数估计 原理:最大似然原理:最大似然(l
7、ikelihood)估计估计 2023-2-1616)(exp01ccbROjj若自变量jX只有暴露和非暴露两个水平,则优势比jOR的1可信区间估计公式为)exp(2/jbjSub 2.优势比估计优势比估计 可反映某一因素两个不同水平(c1,c0)的优势比。2023-2-1617例16-1 表16-1是一个研究吸烟、饮酒与食道癌关系的病例对照资料,试作logistic回归分析。121 0 1 0 1 0 XXY吸烟不吸烟饮酒不饮酒病例对照确确定定各各变变量量编编码码 2023-2-1618分层 吸烟 饮酒 观察例数 阳性数 阴性数 g X1 X2 ng dg ng dg 1 0 0 199 6
8、3 136 2 0 1 170 63 107 3 1 0 101 44 57 4 1 1 416 265 151 表表16-1 吸烟与食道癌关系的病例对照调查资料吸烟与食道癌关系的病例对照调查资料 2023-2-1619=0.1572 吸烟与不吸烟的优势比:11expexp0.8856=2.42ORb 经logistic回归计算后得:0b=-0.9099,0bS=0.1358;1b=0.8856,1bS=0.1500;2b=0.5261,2bS=0.1572 吸 烟 与 不 吸 烟 的 优 势 比:1OR的 95可信区间:110.05/2expexp(0.88561.960.1500)(1.8
9、1,3.25)bbuS 饮酒与不饮酒的优势比:饮酒与不饮酒的优势比:饮酒与不饮酒的优势比:22expexp0.52611.69ORb 22exp(1.96)exp(0.5261 1.96 0.1572)(1.24,2.30)bbS2OR的95可信区间:2023-2-1620 三、三、logistic回归模型的假设检验回归模型的假设检验 Wald 检验 将各参数的估计值jb与 0 比较,而用它的标准误jbS作为参照,检验统计量为 2,1jjjjbbbbuSS2 或 221220111022120.8856 34.860.15000.5261 11.200 :0,:0,0.05,:0,:0,.15
10、7 0 05,2.HHHH 2值均大于 3.84,说明食道癌与吸烟、饮酒有关系,结论同前。2.1.似然比检验2023-2-1621方法:方法:前进法、后退法和逐步法前进法、后退法和逐步法。检验统计量:检验统计量:不是不是 F 统计量,而是似然比统计量、统计量,而是似然比统计量、Wald 统计量和计分统计量之一。统计量和计分统计量之一。四、变量筛选四、变量筛选例16-2 为了探讨冠心病发生的有关危险因素,对为了探讨冠心病发生的有关危险因素,对26例冠心病病人和例冠心病病人和28例对照者进行病例例对照者进行病例 对照研究,各对照研究,各因素的说明及资料见表因素的说明及资料见表16-2和表和表16-
展开阅读全文