书签 分享 收藏 举报 版权申诉 / 40
上传文档赚钱

类型论文经典方法Logistic回归分析及其应用(课堂PPT)课件(PPT 40页).pptx

  • 上传人(卖家):三亚风情
  • 文档编号:3451780
  • 上传时间:2022-09-01
  • 格式:PPTX
  • 页数:40
  • 大小:157.70KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《论文经典方法Logistic回归分析及其应用(课堂PPT)课件(PPT 40页).pptx》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    论文经典方法Logistic回归分析及其应用课堂PPT课件PPT 40页 论文 经典 方法 Logistic 回归 分析 及其 应用 课堂 PPT 课件 40
    资源描述:

    1、LogisticLogistic回归分析回归分析及其应用及其应用温泽淮温泽淮DME中心中心7/31/20221.第1页,共40页。概述概述1967年年Truelt J,Connifield J和和Kannel W在在Journal of Chronic Disease上发表了冠心病危险因素上发表了冠心病危险因素的研究,较早将的研究,较早将Logistic回归用于医回归用于医学研究。学研究。一般概念一般概念l一元直线回归一元直线回归l多元直线回归多元直线回归7/31/20222.第2页,共40页。一元直线回归模型一元直线回归模型 y=a+b x+e多元直线回归模型多元直线回归模型 y=a+b1x

    2、1+b2x2+bkxk+e7/31/20223.第3页,共40页。-4.00-2.000.002.004.00X X:自变量:自变量0.000.250.500.751.00F(y):因变量的logit值如果一定要进行直线回归也可以做出结果,但此时效果不佳。当自变量取一定值时,因变量的预测值可能为负数。7/31/20224.第4页,共40页。一般直线回归难以解决的问题一般直线回归难以解决的问题医学数据的复杂、多样医学数据的复杂、多样l连续型和离散型数据连续型和离散型数据医学研究中疾病的复杂性医学研究中疾病的复杂性l一种疾病可能有多种致病因素或与多种危一种疾病可能有多种致病因素或与多种危险因素有关

    3、险因素有关l疾病转归的影响因素也可能多种多样疾病转归的影响因素也可能多种多样l临床治疗结局的综合性临床治疗结局的综合性7/31/20225.第5页,共40页。简单的解决方法简单的解决方法固定其他因素,研究有影响的一两个因固定其他因素,研究有影响的一两个因素;素;分层分析:按分层分析:按12个因素组成的层进行个因素组成的层进行层内分析和综合。层内分析和综合。统计模型统计模型7/31/20226.第6页,共40页。寻找合适的模型寻找合适的模型进行进行logit变换变换llogit(p)=ln(),p为为y=1所对应的概率所对应的概率 logit(0.1)=ln()=ln(0.1/0.9)p1 p0

    4、.11 0.17/31/20227.第7页,共40页。llogit(p)=ln()p=0或或1时,此式失效时,此式失效 以以 p=r/n 代之代之 logit(p)=ln (r+0.5)/(n r+0.5)此称此称经验经验logistic变换变换 以以Z代上式的代上式的logit(p),Z=a+b1x1+b2x2+bkxk 称此为称此为logistic回归模型回归模型p1 p7/31/20228.第8页,共40页。P=ez/(1+ez)ea+b1x1+b2x2+bkxk 1+ea+b1x1+b2x2+bkxk此为非条件此为非条件logistic回归模型回归模型 应用于成组数据的分析应用于成组数

    5、据的分析P=7/31/20229.第9页,共40页。自变量取定一些值时,因变量取自变量取定一些值时,因变量取0 0、1 1的概率就是条的概率就是条件概率,对条件概率进行件概率,对条件概率进行logisticlogistic回归,称为回归,称为条件条件logisticlogistic回归回归表达式:表达式:eb1x1+b2x2+bkxk 1-eb1x1+b2x2+bkxk 常用于分析配比的资料常用于分析配比的资料P=7/31/202210.第10页,共40页。概述小结概述小结logistic回归回归对因变量的比数的对数值对因变量的比数的对数值(logit值)建立模型值)建立模型因变量的因变量的l

    6、ogit值值的改变与多个自变量的的改变与多个自变量的加权和加权和呈线性关系呈线性关系因变量呈二项分布因变量呈二项分布7/31/202211.第11页,共40页。分析的一般步骤分析的一般步骤变量的编码变量的编码哑变量的设置和引入哑变量的设置和引入各个自变量的单因素分析各个自变量的单因素分析变量的筛选变量的筛选交互作用的引入交互作用的引入建立多个模型建立多个模型选择较优的模型选择较优的模型模型应用条件的评价模型应用条件的评价输出结果的解释输出结果的解释7/31/202212.第12页,共40页。1.1.变量的编码变量的编码变量的编码要易于识别变量的编码要易于识别注意编码的等级关系注意编码的等级关系

    7、改变分类变量的编码,其分析的意改变分类变量的编码,其分析的意义并不改变。义并不改变。牢记编码牢记编码l使用变量数值标识(使用变量数值标识(value labels)l记录编码内容记录编码内容7/31/202213.第13页,共40页。变量的编码变量的编码变量名 变量标识 变量值 值标识 SEX 性别 1 男 2 女 EDU 教育程度 0 文盲 1 小学 2 初中及以上 7/31/202214.第14页,共40页。variable labelsqnum 问卷序号rnum 录入序号pnum 病人编号hnum 住院号/门诊号chname 患者中文姓名drugroup 组别name 患者姓名sex 患

    8、者性别age 患者年龄value labelssex 1 男 2 女/hisc 1 是 0 否 9 无法判断/nsex 1 正常 0 异常 9 未检/demdx 1 有 0 无/addx 0 无 1 危险性 2 可能 3 很可能/edu 0 文盲 1 小学程度 2 初中及以上7/31/202215.第15页,共40页。2.2.哑变量的设置和引入哑变量的设置和引入哑变量,又称哑变量,又称指示变量指示变量或或设计矩阵设计矩阵。有利于检验等级变量各个等级间的变有利于检验等级变量各个等级间的变化是否相同。化是否相同。一个一个k分类的分类变量,可以用分类的分类变量,可以用k-1个个哑变量来表示。哑变量来

    9、表示。7/31/202216.第16页,共40页。哑变量的设置教育程度X1X2X3文盲:0000小学:1100初中:2010高中:3001教育程度教育程度:文盲,小学,初中,高中以上文盲,小学,初中,高中以上7/31/202217.第17页,共40页。教育程度X1X2X3文盲:0100小学:1010初中:2001高中:3000以高中作为参照以高中作为参照7/31/202218.第18页,共40页。SPSS提供的方法Indicator:默认。以第1 或最后1类作对照,其他每类与对照比较;Sample:以第1 或最后1类作对照,其他每类与对照比较,但反映平均效应。Difference:除第1类外各

    10、分类与其前各类平均效应比较;Helmert:除最后1类外各分类与其前各类平均效应比较;Repeated:除第1类外各分类与其前一类比较;Polynomial:假设类间距相等,用于数值型变量。Deviation:以第1 或最后1类作对照,其余每类与总效应比较。7/31/202219.第19页,共40页。3.3.自变量的单因素分析自变量的单因素分析了解自变量与因变量的分布了解自变量与因变量的分布检验是否符合建立模型的应用条件检验是否符合建立模型的应用条件l偏离应用条件时,进行数据变换偏离应用条件时,进行数据变换各个自变量两组间的比较各个自变量两组间的比较l计数资料计数资料l计量资料计量资料双变量分

    11、析双变量分析7/31/202220.第20页,共40页。4.4.变量的筛选变量的筛选变量筛选的原则变量筛选的原则l专业上考虑专业上考虑l测量上考虑测量上考虑l共线性问题:计算相关矩阵,相关系数共线性问题:计算相关矩阵,相关系数0.8-0.9,则选其一。,则选其一。l缺失数据少、测量误差低的优先选择缺失数据少、测量误差低的优先选择l经验上考虑经验上考虑l双变量分析中有显著性的自变量(双变量分析中有显著性的自变量(P.15)l选择那些改变主效应的自变量选择那些改变主效应的自变量7/31/202221.第21页,共40页。变量的筛选变量的筛选变量筛选的可用方法变量筛选的可用方法l逐步逐步logist

    12、ic回归:回归:自动选择有显著性的自变量,不自动选择有显著性的自变量,不仅用于自变量的剔选,也用于交互作用项是否显著仅用于自变量的剔选,也用于交互作用项是否显著的判断。的判断。l前进法:前进法:逐个引入模型外的变量逐个引入模型外的变量l后退法:后退法:放入所有变量,再逐个筛选放入所有变量,再逐个筛选 理论上看,前进法选择变量的经验公式缺乏总体概念,当用于因理论上看,前进法选择变量的经验公式缺乏总体概念,当用于因素分析时,建议用后退法。当变量间有完全相关性时,后退法无法素分析时,建议用后退法。当变量间有完全相关性时,后退法无法使用,可用前进法。使用,可用前进法。7/31/202222.第22页,

    13、共40页。5.5.交互作用的引入交互作用的引入交互作用的定义交互作用的定义l当自变量和因变量的关系随第三个变量当自变量和因变量的关系随第三个变量的变化而改变时,则存在交互作用的变化而改变时,则存在交互作用交互作用项的引入交互作用项的引入l基于临床实际认为对结果有重要影响基于临床实际认为对结果有重要影响l基于模型应用条件的分析基于模型应用条件的分析l引入两个自变量的乘积项引入两个自变量的乘积项交互作用的检验交互作用的检验交互作用的解释交互作用的解释7/31/202223.第23页,共40页。6.6.建立多个模型建立多个模型饱和模型饱和模型自定义的模型自定义的模型l从饱和模型中选择自变量从饱和模型

    14、中选择自变量l再建立模型再建立模型7/31/202224.第24页,共40页。7.7.选择较优的模型选择较优的模型模型拟合优度检验模型拟合优度检验lAIC(Akaike information criterion):):同一资料的多个模型的比较,此值越小,模型越合适。同一资料的多个模型的比较,此值越小,模型越合适。lSC(Schwartz criterion):同上):同上lScore统计量统计量:同上,但不包括截距项。:同上,但不包括截距项。l-2logL(似然比检验,(似然比检验,Omnibus Test):检验全部自变量:检验全部自变量的作用是否显著。较为可靠。适用于含连续性变量的情况。

    15、模型的作用是否显著。较为可靠。适用于含连续性变量的情况。模型拟合好,拟合好,x2值大,值大,P值小。值小。lHosmer-Lemeshow检验:检验:评价估计概率和观察概率接近的程评价估计概率和观察概率接近的程度。适用于含连续性变量的情况。模型好,度。适用于含连续性变量的情况。模型好,x2值小,值小,P值大。值大。7/31/202225.第25页,共40页。8.8.模型应用条件的评价模型应用条件的评价残差分析残差分析l残差是观察值与估计值之差残差是观察值与估计值之差合理的合理的logistic回归模型也可能得到回归模型也可能得到不理想的残差,这在自变量是二分类不理想的残差,这在自变量是二分类变

    16、量时更易出现。变量时更易出现。增加交互作用项可能增加模型的效能增加交互作用项可能增加模型的效能7/31/202226.第26页,共40页。9.9.输出结果的解释输出结果的解释模型中各个系数的显著性检验模型中各个系数的显著性检验lWald检验:检验:类似于直线回归系数的类似于直线回归系数的t检检验验lWald x2检验:检验:同上同上l似然比检验:似然比检验:自变量不在模型中与在自变量不在模型中与在模型中的似然值比较。模型中的似然值比较。lScore检验检验7/31/202227.第27页,共40页。输出结果的解释输出结果的解释回归系数的解释回归系数的解释l系数的正负值:系数的正负值:正(负)系

    17、数表示随自变量的正(负)系数表示随自变量的增加因变量增加因变量logit值的增加(减少)。值的增加(减少)。l二分类自变量二分类自变量 系数为比数比的对数值,由此比数比系数为比数比的对数值,由此比数比=ebl多分类自变量多分类自变量 以第以第i类作参照,比较相邻或相隔的两个类别。类作参照,比较相邻或相隔的两个类别。l连续型自变量连续型自变量 当自变量改变一个单位时,比数比为当自变量改变一个单位时,比数比为eb7/31/202228.第28页,共40页。输出结果的解释输出结果的解释模型拟合的优劣模型拟合的优劣自变量与结果变量(因变量)有无关系自变量与结果变量(因变量)有无关系确认因变量与自变量的

    18、编码确认因变量与自变量的编码模型包含的各个自变量的临床意义模型包含的各个自变量的临床意义由模型回归系数计算得到的各个自变由模型回归系数计算得到的各个自变量的比数比的临床意义量的比数比的临床意义7/31/202229.第29页,共40页。输出结果的解释输出结果的解释模型的预测结果的评价模型的预测结果的评价l敏感度、特异度和阳性预测值敏感度、特异度和阳性预测值 正确选择预测概率界值,简单地以正确选择预测概率界值,简单地以0.5为界为界值,但并不是最好的。值,但并不是最好的。lC指数指数 预测结果与观察结果的一致性的度量。预测结果与观察结果的一致性的度量。C值越大(最大为值越大(最大为1),模型预测

    19、结),模型预测结果的能力越强。果的能力越强。7/31/202230.第30页,共40页。非条件非条件logisticlogistic回归回归研究对象之间是否发生某事件是研究对象之间是否发生某事件是独立的。独立的。适用于:适用于:l成组的病例成组的病例-对照研究对照研究l无分层的队列研究或横断面调查无分层的队列研究或横断面调查l诊断性试验诊断性试验7/31/202231.第31页,共40页。条件条件logisticlogistic回归回归研究中有研究中有N个配比组,每组中个配比组,每组中n个病例个病例配配m个对照者。这时,各个研究对象个对照者。这时,各个研究对象发生某事件的概率即为条件概率。发生

    20、某事件的概率即为条件概率。适用于适用于l配比设计的病例配比设计的病例-对照研究对照研究l精细分层设计的队列研究精细分层设计的队列研究7/31/202232.第32页,共40页。logisticlogistic回归的应用回归的应用疾病影响因素的研究疾病影响因素的研究校正混杂因素校正混杂因素疾病预后的估计疾病预后的估计疾病诊断疾病诊断7/31/202233.第33页,共40页。疾病影响因素的研究疾病影响因素的研究病因学研究病因学研究l病例病例-对照研究对照研究l队列研究队列研究影响因素的研究影响因素的研究l横断面调查横断面调查l临床试验临床试验7/31/202234.第34页,共40页。校正混杂因

    21、素校正混杂因素一般采用一般采用Mantel-Haenszel分层分分层分析析分层较细或存在格子零频数时,分层较细或存在格子零频数时,M-H法无法采用。法无法采用。logistic回归分析可综合校正多个回归分析可综合校正多个混杂因素的影响混杂因素的影响7/31/202235.第35页,共40页。疾病预后的估计疾病预后的估计logistic回归模型作为一种概率模型,回归模型作为一种概率模型,可用于预测某事件发生的概率。可用于预测某事件发生的概率。logistic回归不要求在因变量正态假设回归不要求在因变量正态假设的前提下进行预测。的前提下进行预测。7/31/202236.第36页,共40页。疾病诊

    22、断疾病诊断疾病诊断的判别疾病诊断的判别诊断性试验研究中,敏感度和特异度诊断性试验研究中,敏感度和特异度的估计的估计llogistic回归模型综合校正协变量的回归模型综合校正协变量的影响影响l充分利用数据提供的信息充分利用数据提供的信息l可进行可进行95%可信区间的估计可信区间的估计7/31/202237.第37页,共40页。logistic回归的其他问题回归的其他问题多分类多分类logistic回归模型回归模型l因变量为二分类变量因变量为二分类变量l因变量为多分类变量因变量为多分类变量 多分类多分类logistic回归回归7/31/202238.第38页,共40页。其他问题其他问题研究对象例数

    23、的确定研究对象例数的确定l研究设计时样本含量的估计研究设计时样本含量的估计l经验方法:经验方法:模型中的每一自变量至少模型中的每一自变量至少需要出现需要出现10个结局个结局。给定例数时自变量太多给定例数时自变量太多l删除变量删除变量l合并变量及变量的分类合并变量及变量的分类7/31/202239.第39页,共40页。其他问题其他问题logistic回归的局限性回归的局限性l理论上的不足:理论上的不足:自变量对疾病的影响是独立自变量对疾病的影响是独立的,但实际情况及推导结果不同。的,但实际情况及推导结果不同。l模型有不合理性:模型有不合理性:“乘法模型乘法模型”与一般希望的与一般希望的“相加模型相加模型”相矛盾。相矛盾。l最大似然法估计参数的局限最大似然法估计参数的局限l样本含量不宜太少:样本含量不宜太少:例数大于例数大于200例时才可例时才可不考虑参数估计的偏性。不考虑参数估计的偏性。7/31/202240.第40页,共40页。

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:论文经典方法Logistic回归分析及其应用(课堂PPT)课件(PPT 40页).pptx
    链接地址:https://www.163wenku.com/p-3451780.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库