Logistic回归分析分析课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《Logistic回归分析分析课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Logistic 回归 分析 课件
- 资源描述:
-
1、391第十六章第十六章logistic回归分析回归分析(Logistic Regression)392Content?Logistic regression ?Conditional logistic regression ?Application393讲述内容讲述内容: :第一节 logistic回归第二节 条件logistic回归第三节 logistic回归的应用及其注意事项394目的:作出以多个自变量(危险因素)估计应变量(结果因素)的logistic回归方程。属于概率型非线性回归。资料:1. 应变量为反映某现象发生与不发生的二值变量;2. 自变量宜全部或大部分为分类变量,可有少数数值变
2、量。分类变量要数量化。395用途:研究某种疾病或现象发生和多个危险因素(或保护因子)的数量关系。用检验(或u检验)的局限性:1. 只能研究1 个危险因素;2. 只能得出定性结论。2?396种类:1. 成组(非条件)logistic回归方程。2. 配对(条件)logistic回归方程。397第一节第一节logistic回归回归(非条件logistic 回归 )398一、基本概念1 0 Y?发生应变量未发生12,mX XXL自变量,在m个自变量的作用下阳性结果发生的概率记作:),| 1(21mXXXYPP?1P?039911ZPe?若令:mmXXXZ?2211001122ln=1mmPXXXP?L
3、0112211 exp ()mmPXXX?L回归模型其中0?为常数项, m?,21?为回归系数。 概率P:01,logit P:。取值范围logitP3910图图16-1logistic函数的图形00.51-4-3-2-1012340.5PZ:, 0, : 0, 0.5, 1PZ ?3911模型参数的意义01122ln=logit1mmPXXXPP?L常数项表示暴露剂量为0时个体发病与不发病概率之比的自然对数。回归系数表示自变量改变一个单位时logitP 的改变量。0?), 2 , 1(mjj?jX3912流行病学衡量危险因素作用大小的 比数比例指标。指标。计算公式为:计算公式为:1100/(
4、1)/(1)jPPORPP?优势比优势比OR(odds ratio)式中1P和0P分别表示在jX取值为1c及0c时的发病概率,jOR称作多变量调整后的优势比,表示扣除了其他自变量影响后危险因素的作用。 3913111000010010/(1)lnlnlogitlogit/(1)()()()jmmjttjtttjtjjPPORPPPPcXcXcc?对比某一危险因素两个不同暴露水平1cXj?与0cXj?的发病情况(假定其它因素的水平相同) ,其优势比的自然对数为: 与与logistic P 的关系的关系:39140, 1 exp, 0, 1 0, 1 jjjjjjOROROROR?无作用危险因保子
5、护因子则有101 , 1, 0 jccX?暴非若暴露露由于jOR值与模型中的常数项0?无关,0?在危险因素分析中通常视其为无效参数。 1100/(1) 1, /(1)PPPORRRPP?当则有10 exp()jjORcc?即3915 11(1)iinYYiiiLPP? 1lnln(1) ln(1)niiiiiLYPYP? mbbbb,210? 二、logistic回归模型的参数估计回归模型的参数估计1.参数估计参数估计原理:最大似然原理:最大似然(likelihood)估计3916 )(exp?01ccbROjj?若自变量jX只有暴露和非暴露两个水平, 则优势比jOR的?1可信区间估计公式为
6、)exp(2/jbjSub?2 . 优势比估计 可反映某一因素两个不同水平(c1,c0)的优势比。3917例16-1 表16-1是一个研究吸烟、饮酒与食道癌关系的病例对照资料,试作 logistic回归分析。121 0 1 0 1 0 XXY?吸烟不吸烟饮酒不饮酒病例对照确定各变量编码3918分层 吸烟 饮酒 观察例数 阳性数 阴性数 g X1 X2 ng dg ng? dg 1 0 0 199 63 136 2 0 1 170 63 107 3 1 0 101 44 57 4 1 1 416 265 151 表16-1 吸烟与食道癌关系的病例对照调查资料3919logistic 回归计算后得
7、 0b=-0.9099 ,0bS=0.1358 ;1b=0.8856 , 1bS=0.1500 ;2b=0.5261 ,2bS=0.1572 吸烟与不吸烟的优势比:11?expexp0.8856=2.42ORb? 1OR的 95?可信区间 : 110.05 / 2expexp(0.88561.960.1500)(1.81,3.25)bbuS? 饮酒与不饮酒的优势比: 22?expexp 0.52611.69ORb? 2OR的 95?可信区间 : 22exp(1.96)exp(0.52611.960.1572)(1.24, 2.30)bbS? 经logistic回归计算后得:经 logistic
8、 回归计算后得 0b=-0.9099 ,0bS=0.1358 ;1b=0.8856 , 1bS=0.1500 ;2b=0.5261 ,2bS=0.1572 吸烟与不吸烟的优势比:11?expexp 0.8856=2.42ORb? 1OR的 95?可信区间: 110.05 / 2expexp(0.88561.960.1500)(1.81,3.25)bbuS? 饮酒与不饮酒的优势比: 22?expexp 0.52611.69ORb? 2OR的 95?可信区间: 22exp(1.96)exp(0.52611.960.1572)(1.24, 2.30)bbS? logistic 回归计算后得 0b=-
9、0.9099 ,0bS=0.1358 ;1b=0.8856 , 1bS=0.1500 ;2b=0.5261 ,2bS=0.1572 吸烟与不吸烟的优势比:11?expexp0.8856=2.42ORb? 1OR的 95?可信区间 : 110.05 / 2expexp(0.88561.960.1500)(1.81,3.25)bbuS? 饮酒与不饮酒的优势比: 22?expexp 0.52611.69ORb? 2OR的 95?可信区间 : 22exp(1.96)exp(0.52611.960.1572)(1.24, 2.30)bbS? logistic 回归计算后得 0b=-0.9099 ,0bS
10、=0.1358 ;1b=0.8856 , 1bS=0.1500 ;2b=0.5261 ,2bS=0.1572 吸烟与不吸烟的优势比:11?expexp0.8856=2.42ORb? 1OR的 95?可信区间 : 110.05 / 2expexp(0.88561.960.1500)(1.81,3.25)bbuS? 饮酒与不饮酒的优势比: 22?expexp 0.52611.69ORb? 2OR的 95?可信区间 : 22exp(1.96)exp(0.52611.960.1572)(1.24, 2.30)bbS? logistic 回归计算后得 0b=-0.9099 ,0bS=0.1358 ;1b
11、=0.8851bS=0.1500 ;2b=0.5261 ,2bS=0.15吸烟与不吸烟的优势比:1?expOR ?1OR的 95?可信区间 : 110.05 /2expexp(0.88561.960bbuS?饮酒与不饮酒的优势比: 22?expexp 0.52611.69ORb? 2OR的 95?可信区间 : 22exp(1.96)exp(0.52611.960bbS?22exp(1.96)exp(0.52611.960.1572)(1.24,2.30)bbS?2OR的95?可信区间:3920三、logistic 回归模型的假设检验Wald 检验 将各参数的估计值jb与 0 比较,而用它的标准
12、误jbS作为参照,检验统计量为 2, 1jjjjbbbbuSS?2 或 221220111022120.8856 34.860.15000.5261 11.200 :0, :0, 0.05,:0, :0,.157 0 05,2.HHHH? ?2值均大于 3.84,说明食道癌与吸烟、饮酒有关系,结论同前。2.1.似然比检验3921方法:前进法、后退法和逐步法 。检验统计量:不是 F 统计量,而是似然比统计量、Wald 统计量和计分统计量之一。四、变量筛选例16-2为了探讨冠心病发生的有关危险因素,对 26例冠心病病人和28 例对照者进行病例?对照研究,各因素的说明及资料见表 16-2和表16-3
展开阅读全文