医学统计医学宣教培训课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《医学统计医学宣教培训课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 统计 宣教 培训 课件
- 资源描述:
-
1、医学统计医学宣教医学统计医学宣教数据挖掘分析数据挖掘分析 第二部分第二部分LogisticLogistic回归回归 第一部分第一部分2医学统计医学宣教第一部分3医学统计医学宣教回归分析的分类回归分析的分类多个因变量多个因变量(y1,y2,yk)路径分析路径分析结构方程模型分析结构方程模型分析一个一个因变因变量量 y连续型因变量连续型因变量(y)-线性回归分析线性回归分析分类型因变量分类型因变量(y)-Logistic 回归分析回归分析时间序列因变量时间序列因变量(t)-时间序列分析时间序列分析生存时间因变量生存时间因变量(t)-生存风险回归分析生存风险回归分析4医学统计医学宣教多重线性回归多重
2、线性回归logisticlogistic回归回归5医学统计医学宣教 logisticlogistic回归(回归(logistic regressionlogistic regression)是研究因)是研究因变量为二分类或多分类观察结果与影响因变量为二分类或多分类观察结果与影响因素(自变量)之间关系的一种多变量分析素(自变量)之间关系的一种多变量分析方法,属概率型非线性回归。方法,属概率型非线性回归。6医学统计医学宣教logisticlogistic回归的分类:回归的分类:(1 1)二分类资料)二分类资料logisticlogistic回归:回归:因变量因变量为两分类变量为两分类变量的资料,可
3、用非条件的资料,可用非条件logisticlogistic回归和条件回归和条件logisticlogistic回归回归进行分析。非条件进行分析。非条件logisticlogistic回归多用于非配比病例回归多用于非配比病例-对对照研究或队列研究资料,条件照研究或队列研究资料,条件logisticlogistic回归多用于配回归多用于配对或配比资料。对或配比资料。(2 2)多分类资料)多分类资料logisticlogistic回归:回归:因变量因变量为多项分类的为多项分类的资料,可用多项分类资料,可用多项分类logisticlogistic回归模型或有序分类回归模型或有序分类logisticlo
4、gistic回归模型进行分析。回归模型进行分析。7医学统计医学宣教队列研究队列研究(cohort study)(cohort study):也称前瞻性研究、随访研究等。是一种由因及果也称前瞻性研究、随访研究等。是一种由因及果的研究,在研究开始时,根据以往有无暴露经历,将研究人群分为暴露人的研究,在研究开始时,根据以往有无暴露经历,将研究人群分为暴露人群和非暴露人群,在一定时期内,随访观察和比较两组人群的发病率或死群和非暴露人群,在一定时期内,随访观察和比较两组人群的发病率或死亡率。如果两组人群发病率或死亡率差别有统计学意义,则认为暴露和疾亡率。如果两组人群发病率或死亡率差别有统计学意义,则认为
5、暴露和疾病间存在联系。病间存在联系。队列研究验证的暴露因素在研究开始前已存在,研究者知队列研究验证的暴露因素在研究开始前已存在,研究者知道每个研究对象的暴露情况。道每个研究对象的暴露情况。研究人群研究人群+-+-调查方向:追踪收集资料调查方向:追踪收集资料比较比较疾病疾病人数人数暴露暴露abcda/(a+b)c/(c+d)队列研究原理示意图队列研究原理示意图8医学统计医学宣教RRRR(相对危险度(相对危险度relative riskrelative risk):表示暴露组与非暴露组):表示暴露组与非暴露组发病率发病率(或死亡率或死亡率)的比值。也称为危险比(的比值。也称为危险比(risk ra
6、tiorisk ratio)。)。反映了暴露与疾病发生的关联强度。反映了暴露与疾病发生的关联强度。RRRR表明暴露组发病或死亡的危险是非暴露组的多少倍。表明暴露组发病或死亡的危险是非暴露组的多少倍。9医学统计医学宣教 病例对照研究病例对照研究(case-control studies)(case-control studies):一种由果及因的回顾性一种由果及因的回顾性研究,先按疾病状态确定调查对象,分为病例研究,先按疾病状态确定调查对象,分为病例(case)(case)和对照和对照(control)(control)两组,然后利用已有的记录、或采用询问、填写调查两组,然后利用已有的记录、或采
7、用询问、填写调查表等方式,了解其发病前的暴露情况,并进行比较,推测疾病表等方式,了解其发病前的暴露情况,并进行比较,推测疾病与暴露间的关系。与暴露间的关系。+-病例病例+-对照对照调查方向:收集回顾性资料调查方向:收集回顾性资料abcda/(a+b)c/(c+d)比较比较人数人数暴露暴露疾病疾病病例对照原理示意图病例对照原理示意图10医学统计医学宣教11医学统计医学宣教病例对照研究的类型病例对照研究的类型(一)病例与对照不匹配(一)病例与对照不匹配-非条件非条件logisticlogistic回归回归在设计所规定的病例和对照人群中,分别抽取一定量的研究对在设计所规定的病例和对照人群中,分别抽取
8、一定量的研究对象,一般对照应等于或多于病例数,此外无其他任何限制。象,一般对照应等于或多于病例数,此外无其他任何限制。(二)病例与对照匹配(二)病例与对照匹配-条件条件logisticlogistic回归回归匹配或称配比(匹配或称配比(matchingmatching),即要求对照在某些因素或特),即要求对照在某些因素或特征上与病例保持一致,目的是对两组比较时排除混杂因素征上与病例保持一致,目的是对两组比较时排除混杂因素的干扰。匹配分为成组匹配和个体匹配。的干扰。匹配分为成组匹配和个体匹配。12医学统计医学宣教非条件非条件logisticlogistic回归回归应变量为二分类资料应变量为二分类
9、资料一个二分类自变量一个二分类自变量两个(多个)二分类自变量两个(多个)二分类自变量无序多分类自变量无序多分类自变量有序多分类自变量有序多分类自变量引入数值型自变量引入数值型自变量应变量为有序多分类资料应变量为有序多分类资料应变量为无序多分类资料应变量为无序多分类资料13医学统计医学宣教二分类资料的二分类资料的logisticlogistic回归回归 二分类二分类 logistic logistic 回归对自变量没有特殊要求回归对自变量没有特殊要求,自变量可以是分类变量自变量可以是分类变量(包括二分类和多包括二分类和多分类变量分类变量)和数值变量。和数值变量。二分类资料的二分类资料的logis
10、ticlogistic回归通过回归通过SPSSSPSS统计软件统计软件的的二元二元LogisticLogistic过程实现统计分析。过程实现统计分析。14医学统计医学宣教【例例1 1】某某医师为研究妇女服避孕药与子代染医师为研究妇女服避孕药与子代染色体异常的关系,分别调查了子代染色体异色体异常的关系,分别调查了子代染色体异常和正常的同龄组儿童的母亲常和正常的同龄组儿童的母亲5454名和名和196196名,名,结果如表结果如表。试对此资料进行分析,能否提出试对此资料进行分析,能否提出子代染色体异常与其母在孕前子代染色体异常与其母在孕前6 6个月内服用避个月内服用避孕药有关?孕药有关?15医学统计
11、医学宣教SPSS软件操作软件操作 第第1 1步:定义变量步:定义变量16医学统计医学宣教 第第2 2步:步:输入原输入原始数据始数据17医学统计医学宣教 第第3 3步:加权设置步:加权设置 选择选择数据数据加权个案(加权个案(WW)将将f f移入移入频率变量频率变量18医学统计医学宣教 第第4 4步:步:logisticlogistic回归分析(回归分析(1 1)选择选择分析分析 回归回归二元二元logisticlogistic19医学统计医学宣教 第第4 4步:步:logisticlogistic回归分析(回归分析(2 2)将将a a和和b b分别移入分别移入协变量协变量和和因变量因变量20
12、医学统计医学宣教 自变量全部进入模型自变量全部进入模型 向前逐步选择法向前逐步选择法 向后逐步剔除法向后逐步剔除法 条件:将变量剔除出模型的依条件:将变量剔除出模型的依据是条件参数估计的似然比统据是条件参数估计的似然比统计量的概率值。计量的概率值。LRLR:将变量剔除出模型的依据:将变量剔除出模型的依据是最大偏似然估计的似然比统是最大偏似然估计的似然比统计量的概率值。计量的概率值。WaldWald:将变量剔除出模型的依:将变量剔除出模型的依据是据是WaldWald统计量的概率值。统计量的概率值。21医学统计医学宣教 第第4 4步:步:logisticlogistic回归分析(回归分析(3 3)
13、设置设置选项选项 勾上勾上expexp(B B)的)的95CI95CI。22医学统计医学宣教 第第4 4步:步:logisticlogistic回归分析(回归分析(4 4)结果解读:结果解读:OR=3.200OR=3.200,p=0.000p=0.000 OROR的的95%CI95%CI为(为(1.7125.9831.7125.983)ExpExp(B B)=e=eB B23医学统计医学宣教 值得注意的是病例值得注意的是病例-对照研究中对照研究中,病例与对病例与对照两组人数的比例是人为规定的照两组人数的比例是人为规定的,不代表不代表自然人群中真实的病人与正常人的比值。自然人群中真实的病人与正常
14、人的比值。因此因此,根据病例一对照研究资料建立的根据病例一对照研究资料建立的 Logistic Logistic 回归方程中回归方程中,常数项意义不大常数项意义不大,主主要针对结果中自变量的回归系数及其相应要针对结果中自变量的回归系数及其相应的比数比的比数比OR OR 值的意义作解释值的意义作解释,不宜直接用不宜直接用于所研究事件发生概率的预测和判别于所研究事件发生概率的预测和判别。24医学统计医学宣教两个二分类自变量两个二分类自变量的的logisticlogistic回归回归 两个自变量均为两水平的二分类资料的两个自变量均为两水平的二分类资料的 Logistic Logistic 回归分析与
15、一个自变量为两水平的回归分析与一个自变量为两水平的二分类资料的二分类资料的 Logistic Logistic 回归分析在步骤方法回归分析在步骤方法上是相同的上是相同的,只是增加了一个自变量只是增加了一个自变量,在在建立建立 LogisticLogistic回归方程时需要对两个自变量回归方程时需要对两个自变量对应的参数进行估计对应的参数进行估计,计算两个比数比。计算两个比数比。另外另外,两个自变量均有意义时两个自变量均有意义时,看哪个影看哪个影响作用更大些响作用更大些,与多重线性回归一样与多重线性回归一样,也也是比较标准偏回归系数绝对值的大小。是比较标准偏回归系数绝对值的大小。25医学统计医学
16、宣教无序多分类自变量的无序多分类自变量的Logistic Logistic 回归回归 自变量是一个或多个为无序多分类变量时自变量是一个或多个为无序多分类变量时,其其 Logistic Logistic 回归在方法上同上述二分类资料的回归在方法上同上述二分类资料的 LogisticLogistic回归回归,只要对只要对自变量的不同水平构造哑变自变量的不同水平构造哑变量量即可。某一多分类无序自变量可构造的哑变量即可。某一多分类无序自变量可构造的哑变量数等于该自变量的分类数减数等于该自变量的分类数减 1 1。将哑变量引入模。将哑变量引入模型型,其结果无论有无统计学意义其结果无论有无统计学意义,都是相
17、对事先都是相对事先确定某一类为基准对照而言的。确定某一类为基准对照而言的。SPSSSPSS对字符型多分类无序自变量对字符型多分类无序自变量,系统默认以最系统默认以最后的那个分类为对照。后的那个分类为对照。26医学统计医学宣教有序多分类自变量的有序多分类自变量的Logistic Logistic 回归回归 Logistic Logistic 回归中自变量为有序多分类变量回归中自变量为有序多分类变量,即等级变量即等级变量,如文化程度可分为文盲、小学如文化程度可分为文盲、小学、中学、大学及以上等。、中学、大学及以上等。这种资料的这种资料的 Logistic Logistic 回归分两种情况处理回归分
18、两种情况处理:如果自变量的等级分组与如果自变量的等级分组与 logit(P)logit(P)呈线性关呈线性关系系,即等级效应等比例增加或减少即等级效应等比例增加或减少,则该自则该自变量可以变量可以作为一个数值型自变量引人模型作为一个数值型自变量引人模型;否则否则,将等级变量视为无序多分类自变量将等级变量视为无序多分类自变量,以哑变量的形式以哑变量的形式引入模型进行分析。引入模型进行分析。27医学统计医学宣教引入数值型自变量的引入数值型自变量的LogisticLogistic回归回归 数值变量直接引入模型数值变量直接引入模型,得到相应的比数比得到相应的比数比 OR OR 是是指自变量增加一个单位
19、指自变量增加一个单位(如年龄增加如年龄增加 1 1 岁岁)比数自然比数自然对数值的变化量。对数值的变化量。若将数值自变量分成几组若将数值自变量分成几组,如自变量年龄按如自变量年龄按 10 10 岁岁间隔分组引人模型时间隔分组引人模型时,其其OR OR 值是指年龄每增加值是指年龄每增加 10 10 岁比数自然对数值的变化量。岁比数自然对数值的变化量。28医学统计医学宣教 数值型变量转换成分类变量的临界点选择数值型变量转换成分类变量的临界点选择,最佳的方法是采用,最佳的方法是采用ROCROC分析。分析。29医学统计医学宣教【例例2 2】为了探索有关危险因素和保护因素,对为了探索有关危险因素和保护因
20、素,对3232例胃癌病人和例胃癌病人和3232例对照者进行病例对照研究,例对照者进行病例对照研究,考察的危险因素作为自变量,分别为:考察的危险因素作为自变量,分别为:x1x1(年龄)(年龄)x2x2(蛋白质摄入量由低到高:(蛋白质摄入量由低到高:0 0,1 1,2 2,3 3,4 4)x3x3(新鲜蔬菜及水果食用情况:良好、一般、不足、严重不足(新鲜蔬菜及水果食用情况:良好、一般、不足、严重不足为为0 0,1 1,2 2,3 3),),x4x4(吃盐量高食物由轻到重为:(吃盐量高食物由轻到重为:0 0,1 1,2 2,3 3,4 4),),x5x5(饮食习惯,从良好,一般,不良,严重不良为:(
21、饮食习惯,从良好,一般,不良,严重不良为:0 0,1 1,2 2,3 3),),x6x6(精神心理因素,从乐观,较乐观,一般,不良为(精神心理因素,从乐观,较乐观,一般,不良为0 0,1 1,2 2,3 3)。Y Y(是否患胃癌作为因变量。(是否患胃癌作为因变量。0 0未患,未患,1 1患者)患者)30医学统计医学宣教。31医学统计医学宣教SPSS软件操作软件操作 第第1 1步:定义变量步:定义变量32医学统计医学宣教 第第2 2步:输入步:输入原始数据原始数据33医学统计医学宣教 第第3 3步:步:logisticlogistic回归分析(回归分析(1 1)选择选择分析分析 回归回归 二元二
22、元logisticlogistic34医学统计医学宣教 第第3 3步:步:logisticlogistic回归分析(回归分析(2 2)将将x1-6x1-6和和y y分别移入分别移入协变量协变量和和因变量因变量35医学统计医学宣教 第第3 3步:步:logisticlogistic回归分析(回归分析(3 3)设置设置选项选项 勾上勾上expexp(B B)的)的95CI95CI。36医学统计医学宣教 第第3 3步:步:logisticlogistic回归分析(回归分析(4 4)结果解读:结果解读:给出各因素的给出各因素的OROR(95%CI95%CI)及)及相应的相应的p p值。值。37医学统计
23、医学宣教 第第3 3步:步:logisticlogistic回归分析(回归分析(5 5)38医学统计医学宣教 第第3 3步:步:logisticlogistic回归分析(回归分析(6 6)39医学统计医学宣教 第第3 3步:步:logisticlogistic回归分析(回归分析(7 7)结果解读:结果解读:给出入选各因素的给出入选各因素的OROR(95%CI95%CI)及相应的及相应的p p值。值。40医学统计医学宣教【例例3 3】为了探讨冠心病发生的有关危险因素,为了探讨冠心病发生的有关危险因素,对对2626例冠心病病人和例冠心病病人和2828例对照者进行病例例对照者进行病例-对照对照研究,
24、各因素的说明及资料研究,各因素的说明及资料如下如下,试用,试用logisticlogistic回归分析方法筛选危险因素回归分析方法筛选危险因素 。41医学统计医学宣教。42医学统计医学宣教SPSS软件操作软件操作 第第1 1步:定义变量步:定义变量43医学统计医学宣教 第第2 2步:输入原始数据步:输入原始数据44医学统计医学宣教 第第3 3步:步:logisticlogistic回归分析(回归分析(1 1)选择选择分析分析 回归回归 二元二元logisticlogistic45医学统计医学宣教 第第3 3步:步:logisticlogistic回归分析(回归分析(2 2)将将x1-8x1-8
25、和和y y分别移入分别移入协变量协变量和和因变量因变量46医学统计医学宣教 第第3 3步:步:logisticlogistic回归分析(回归分析(3 3)设置设置选项选项 勾上勾上expexp(B B)的)的95CI95CI。47医学统计医学宣教 第第3 3步:步:logisticlogistic回归分析(回归分析(4 4)结果解读:结果解读:给出入选各因素的给出入选各因素的OROR(95%CI95%CI)及相应的及相应的p p值。值。48医学统计医学宣教多分类资料的logistic回归 应变量为有序多分类资料的应变量为有序多分类资料的logisticlogistic回归回归应变量的水平数大于
展开阅读全文