流行病学数据统计分析策略课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《流行病学数据统计分析策略课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 流行病学 数据 统计分析 策略 课件
- 资源描述:
-
1、流行病学数据统计分析策略流行病学数据统计分析策略中南大学湘雅公共卫生学院中南大学湘雅公共卫生学院谭红专谭红专 教授教授2022-10-162主要内容主要内容n概述概述n专题研究的数据分析专题研究的数据分析n常规收集的流行病学数据的分析常规收集的流行病学数据的分析 2022-10-163第一节第一节 概述概述n流行病学研究与流行病学数据流行病学研究与流行病学数据n流行病学数据分析的目的流行病学数据分析的目的n流行病学数据中的变量分类流行病学数据中的变量分类n流行病学数据分析的内容流行病学数据分析的内容2022-10-164一、流行病学研究与流行病学数据一、流行病学研究与流行病学数据n狭义的流行病
2、学数据流行病学数据(epidemiological data)指任何来自针对明确研究目的而开展特定流行病学研究所收集的资料。n广义的流行病学数据还包括出于其他目的和用途而收集的、可以用来定量地探索疾病健康或医疗卫生服务其他问题的资料。n即一切可为流行病学所用的数据。目前目前的临床大数据是个宝库。的临床大数据是个宝库。2022-10-165二、流行病学数据分析的目的二、流行病学数据分析的目的n流行病学数据分析是针对明确研究问题、具有针对明确研究问题、具有明确目的明确目的、采用特定方法对流行病学数据进行统计整理、统计描述、统计推断和总结。n流行病学研究的问题涉及疾病分布、病因与危险因素、诊断、预防
3、和治疗效果评价等。n数据分析的根本是正确地回答有意义的问题,而不是统计学数字游戏。2022-10-166流行病学数据分析的目的流行病学数据分析的目的n估计有关统计学指标,如相对危险度;n估计该统计学指标的可信区间;n控制可能的混杂因素;n分析剂量反应关系;n分析可能的效应修饰因子;n分析可能存在的偏倚。2022-10-167三、流行病学数据中的变量分类三、流行病学数据中的变量分类 n典型的流行病学研究中变量可根据其用途分为五类:n暴露变量:因,自变量,可以有多个n结局变量:果,因变量,是数据分析的核心n混杂因素:需要控制n效应修饰因素:需要描述n其他变量:2022-10-168按统计学分类按统
4、计学分类n定性:二分类和多分类(无序多分类)n定量:在多数流行病学研究中被转化为分类变量n半定量(分级,有序多分类)n同一个研究中,因变量和自变量的关系应该是固定的、不能互换。但在不同的研究中,一个变量在这个研究中可能是果,在另一个研究中也可能是因。例如,高血压可能是遗传的结果,血压也可能是心脑血管事件的原因。2022-10-169四、流行病学数据分析的内容四、流行病学数据分析的内容 n描述研究对象的数量变动;n变量分类和数据整理;n描述和比较组间基线资料;n估计结局事件发生频率;n估计效应大小及其可信区间;n识别和控制混杂;n识别和测量效应修饰作用;n识别和测量剂量反应关系;n其他分析。20
5、22-10-1610第二节第二节 流行病学专题研究的数据分流行病学专题研究的数据分析析一、描述研究对象的数量变动一、描述研究对象的数量变动 数据分析的第一步须对研究对象数数据分析的第一步须对研究对象数量随时间的变动进行描述,这是判断选量随时间的变动进行描述,这是判断选择偏倚是否存在及其大小的主要依据;择偏倚是否存在及其大小的主要依据;对选样、抽样和筛选都应交代原则和方对选样、抽样和筛选都应交代原则和方法;对退出和失访都应记录数量和原因法;对退出和失访都应记录数量和原因。2022-10-16112022-10-1612二、流行病学变量的分类与数据转换二、流行病学变量的分类与数据转换n转换目的:习
6、惯、专业考量、模型限制n转换类型:定量转定性或分级,定性转定量n转换常用原则:借鉴既往同类研究的分级方法;按照通用的分级标准,如年龄可按国际通用的婴儿、幼儿、青少年、青年、中年、老年的年龄切点来分级;把研究人群分成每组人数均等的35组等。2022-10-1613三、描述基线资料三、描述基线资料n基线资料就是有关研究对象代表性和混杂因素的信息资料。n基线资料描述的基本目的:一是交待研究对象的特征,提供其代表人群的信息,据此判断结果的外推人群和外推性;二是评估暴露组和非暴露组之间混杂因素的可比性,检查存在混杂的可能性。n描述基线资料时,通常在总体描述基础上,对暴露组和非暴露组还要分别进行描述。20
7、22-10-1614四、结局事件发生的频率四、结局事件发生的频率n一般要求用率表示,如发病率。发病率由三个因素决定:观察时间、可能发病的总人数和实际发病人数。n一般情况下,发病率的分子是在一定时间内发病的总人数。n分母则因研究设计不同而异。当发病率较低,且每个人的观察时间长短基本一致,可用研究开始时该组人数作分母计算发病率,叫做累积发病率(cumulative incidence)。当结局事件发生率较高(如晚期癌症治疗试验中的死亡)或每个人的观察时间相差较大时,这时可用人时数(如人年数,person-years)做分母计算发病率,称作人时发病率(person-time incidence ra
8、te或发病密度(incidence density),2022-10-1615五、估计效应值五、估计效应值n效应就是暴露或治疗对结局作用或影响的大小,多用暴露组与非暴露组或治疗组与对照组间发病率的差别来表达。2022-10-16162022-10-1617六、估计效应可信区间六、估计效应可信区间n由于随机误差,各效应指标的点估计不能代表效应的真实值,可信区间(Confidence Interval,CI)可用来表达由随机误差引起的效应估计值的不确定性。实践中一般采用95%可信区间,可以将其理解为真实效应值有95%的可能在这个区间之内。若效应指标的点估计值为X,标准误为SE,该效应指标的95可信
9、区间:95CI X1.96SE,其中,(X1.96SE)为其下限,(X1.96SE)为其上限。2022-10-1618七、识别和控制混杂七、识别和控制混杂n混杂是由于同一个研究里暴露对某疾病的作用与其他病因的作用交织在一起导致暴露效应估计上的误差。n混杂必须同时具备三个条件:其一,是疾病确定的病因或危险因素;其二,不是暴露和疾病间的中间因素;其三,可疑的混杂因素在暴露组和非暴露组的分布不均衡。如性别可能就是吸烟与肺癌关系中的一个混杂因素。2022-10-1619n混杂的控制就是控制混杂的第三个条件,办法有:n设计阶段有三种方法:限制、匹配和随机分组;n数据分析阶段也有三种方法:直接标化法、分层
展开阅读全文