广义线性模型课件解析.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《广义线性模型课件解析.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 广义 线性 模型 课件 解析
- 资源描述:
-
1、Generalized Linear Models广义线性模型广义线性模型何平平何平平北大医学部流行病与卫生统计学系北大医学部流行病与卫生统计学系Tel:82801619广义线性模型的定义广义线性模型的定义该模型假定:该模型假定:1.Y1,Yn是是n个服从指数分布族的独立样本个服从指数分布族的独立样本 i=E(Yi|X1,X2,Xk),i1,n;2.i是是k个解释变量的线性组合个解释变量的线性组合 i=0+1Xi1+kXik3.存在一个连接函数(存在一个连接函数(Link function)g,使得,使得 i 与与 i有有下面的关系下面的关系 i=g(i)常见分布及其联系函数常见分布及其联系函
2、数指数分布族常见的重要分布如正态分布、二项分布、指数分布族常见的重要分布如正态分布、二项分布、Poisson分布、指数分布等。对非正态广义线性模型,经典的最小二乘分布、指数分布等。对非正态广义线性模型,经典的最小二乘法已不能用于这种模型的拟合,而是采用法已不能用于这种模型的拟合,而是采用最大似然估计方法最大似然估计方法。分布分布 联系函数联系函数正态分布正态分布 =普通线性模型普通线性模型二项分布二项分布 或或多项分布多项分布 =log 对数线性模型对数线性模型(Poisson分布分布)(Poisson回归回归)=logP/(1-P)Logistic回归模型回归模型 =logh(t)/h0(t
3、)COX回归模型回归模型Logistic回归分析回归分析推荐书籍:推荐书籍:Hosmer,David W.(2000).Applied logistic regression.John Wiley,New York.何平平何平平北大医学部流行病与卫生统计学系北大医学部流行病与卫生统计学系Tel:82801619(一)(一)Logistic回归分析的任务回归分析的任务影响因素分析影响因素分析logistic回归常用于疾病的危险因素分析,回归常用于疾病的危险因素分析,logistic回归回归分析可以提供一个重要的指标:分析可以提供一个重要的指标:OR。(二)经典(二)经典Logistic回归分析的
4、基本原理回归分析的基本原理1.变量特点变量特点因变量:因变量:二分类变量,若令因变量为二分类变量,若令因变量为y,则常用,则常用y1表表示示“发病发病”,y0表示表示“不发病不发病”(在病例对照研究中,(在病例对照研究中,分别表示病例组和对照组)。分别表示病例组和对照组)。自变量:自变量:可以为分类变量,也可以为连续变量。可以为分类变量,也可以为连续变量。2.Logistic模型模型P=P(y=1|x),为发病概率;,为发病概率;1-P=P(y=0|x),为不发病概率。,为不发病概率。0为常数项,为常数项,1,2.m分别分别为为m个自变量的回归系数。个自变量的回归系数。01 122().iim
5、mg xxxxx()ln1Pg xPexp()1 exp()g xPg xg(x)是对是对P的变换的变换,称为称为logit变换变换:可以得到:可以得到:模型估计方法:模型估计方法:最大似然法(最大似然法(Maximum Likelihood Method):):构造似然构造似然函数(函数(Likelihood function)L=P(y=1|x)P(y=0|x),通,通过迭代法估计一组参数(过迭代法估计一组参数(0,1,2.m)使)使L达到最达到最大。大。3.模型及自变量的统计检验模型及自变量的统计检验模型检验模型检验:H0:1 2 i m 0 H1:至少有一个:至少有一个 i 0采用似然
6、比检验(采用似然比检验(the likelihood ratio test),当),当P 0.05时,拒绝时,拒绝H0,认为模型有统计学意义,认为模型有统计学意义。自变量自变量检验检验:H0:i0H1:i 0采用采用Wald检验检验,当当P 0.05时,拒绝时,拒绝H0,认为,认为 i不为不为0。4.自变量的筛选自变量的筛选与多元线性回归分析类似,有与多元线性回归分析类似,有Forward法(前进逐步法法(前进逐步法)、)、Backward(后退逐步法(后退逐步法)法。)法。SPSS中默认的选入标准为中默认的选入标准为0.05,剔除标准为,剔除标准为0.10。注注:不同自变量的筛选方法,当结果
7、差别较大时,应该结合不同自变量的筛选方法,当结果差别较大时,应该结合专业知识,用尽可能少的变量拟合一个最佳模型。有研究专业知识,用尽可能少的变量拟合一个最佳模型。有研究者认为,依据者认为,依据Wald统计量统计量(Wald)、似然比统计量、似然比统计量(LR)或者条件统计量或者条件统计量(Conditional)剔除变量时,剔除变量时,LR是决定是决定哪个变量应该被剔除的最好方法。哪个变量应该被剔除的最好方法。5.模型拟合的优良性指标模型拟合的优良性指标(1)拟合分类表()拟合分类表(Classification Table)根据根据Logistic回归模型,对样本重新判别分类,总符合率越回归
8、模型,对样本重新判别分类,总符合率越接近接近100%,则模型拟合越好。,则模型拟合越好。Logistic回归用于判别分类很回归用于判别分类很粗劣,尤其在很多情况下对于小样本的分类效果差粗劣,尤其在很多情况下对于小样本的分类效果差。(2)Hosmer-Lemeshow 拟合优度统计量拟合优度统计量 当检验的当检验的P值大于值大于0.1时,则说明模型对样本的拟合是可以接时,则说明模型对样本的拟合是可以接受的。受的。6.OR与与RRLogistic回归模型中回归模型中,OR=exp()。lnOR=当某种疾病的发病率或死亡率很低时,当某种疾病的发病率或死亡率很低时,OR RROR的置信区间为:的置信区
9、间为:1/2exp()zse例:例:比较新疗法与旧疗法治疗某种疾病的疗效。现对比较新疗法与旧疗法治疗某种疾病的疗效。现对40例患者随机分组,分别接受新疗法和旧疗法治疗。根据例患者随机分组,分别接受新疗法和旧疗法治疗。根据专业知识,患者的病情严重程度、年龄对疗效也有影响。专业知识,患者的病情严重程度、年龄对疗效也有影响。如何评价新旧疗法的疗效(如何评价新旧疗法的疗效(见数据文件见数据文件logistic.sav)?)?(注:作为举例,本例样本量仅为(注:作为举例,本例样本量仅为40例,由于样本量太例,由于样本量太小,小,Logistic回归的结论仅作为参考)回归的结论仅作为参考)变量说明:变量说
展开阅读全文