大学精品课件:医学随访资料的生存分析115.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《大学精品课件:医学随访资料的生存分析115.ppt》由用户(金钥匙文档)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大学 精品 课件 医学 随访 资料 生存 分析 115
- 资源描述:
-
1、生存分析 Survival Analysis,To be or not to be is only a part of the question. The question also includes how long to be.,前 言,为了考察某种慢性病的治疗效果或影响预后的因素,需要通过随访(follow up)搜集每个病人从开始治疗到痊愈的时间。对时间资料进行分析,称为生存分析(survival ananlysis),定 义,生存分析(survival analysis)是将事件的结果(终点事件)和出现这一结果所经历的时间结合起来分析的一种统计分析方法。 生存分析不同于其它多因素分析
2、的主要区别点就是生存分析不仅考虑事件是否出现,而且考虑事件出现的时间长短。因此,也称为事件时间分析(time-to-event ananlysis),例如,某肿瘤医院调查了1991-1995年间经手术治疗的大肠癌患者150例,对可能影响大肠癌术后生存时间的因素进行了调查,如性别、年龄、组织学分类、肿瘤大小、DureS分期等。随访截止日期为2000年12月30日,随访记录见下表。,大肠癌患者的随访记录,生存资料的特点,记录了结局 记录了手术确切的时间和最后一次访问患者的时间。,第一节 生存分析基本概念,起始事件和终点事件 生存时间 生存结局删失 完全数据与不完全数据 生存概率和死亡概率 生存率
3、生存曲线,起始事件和终点事件,终点事件与起始事件之间的时间间隔。 起始事件是反映研究对象生存过程的起始特征的事件。 终点事件指研究者所关心的特定结局。 终点事件和起始事件是相对而言的,它们都由研究目的决定,须在设计时明确规定,并在研究期间严格遵守,不能随意改变。,起始事件 终点事件 服药 痊愈 手术切除 死亡 染毒 死亡 化疗 缓解 缓解 复发 第一次发病 第二次发病,扩展,生存时间,费用,次数,总公里数,生存结局(status),1. 死亡 感兴趣的终点事件; 删失censoring,也称截尾或终检 删失分为:左删失、区间删失、右删失,数据删失的原因,(1)病人失访:由于病人未继续就诊、拒绝
4、访问、迁移等失去联系; (2)病人因其它疾病等造成的意外死亡:如观察食管癌病人的生存时间,死于非食管癌的病人,或死于车祸、中毒等; (3)病人因病情加重等,导致治疗方案的改变; (4)至随访研究结束时仍存在的受试对象而被迫终止随访。,生存时间( survival time,failure time ) 从狭义的角度来说:生存时间是患某病的病人从发病到 死亡所经历的时间跨度。,开始发病,病人死亡,t0,tj,Survival Time,从广义的角度:从某种起始事件到达某种终点时间所经历 的时间跨度。,起始事件,终点事件,t0,tj,Survival Time,生存时间的度量单位可以是年、月、日、
5、小时等。,生存时间数据的类型:,1. 完全数据(complete data) 从起点至死亡(死于所研究疾病)所经历 的时间。常用符号t表示; 2. 不完全数据( incomplete data,删失数据,截尾数据),截尾数据在其右上角标记“+”; 从起点至截尾点所经历的时间,得不到确切的生存时间。 在生存分析研究中,删失值所占的比例不宜太大,且删失的模式应该是随机的。,观察日期 t,观察起点,观察终点,确诊,死亡,截尾,病 人 号,1,2,3,4,90.1.1,92.12.31,95.12.31,t1=2y,t2=4+y,t3=3y,t4=1+y,图1 完全数据与截尾数据,生存时间资料特点,(
6、1)效应变量有2个:一是生存时间(天数),二是结局(死亡与否、是否阳性等)。 (2)存在截尾数据:有些病人未观察到底,不知他们究竟能活多长时间。,(3)分布类型复杂:生存时间资料常通过随访获得,因观察时间长且难以控制混杂因素,故其分布常呈偏态,影响因素较多,规律难以估测。 生存时间的分布通常不呈正态分布,而呈偏态分布,如呈指数分布、weibull分布、Gompertz分布、对数logistic分布等。 因此,生存时间资料不宜简单地计算死亡率,也不能简单地计算生存时间的平均数,必须将两者结合起来分析才能准确地反映疗效和预后的好坏程度,即必须用生存分析方法作统计分析。,第二节 生存概率、生存率、生
7、存曲线、生存中位数,生存概率 生存率 生存曲线 生存中位数,生存概率(probability of survival),表示某单位时段开始时存活的个体,到该时段结束时仍存活的可能性。 年生存概率表示年初尚存人口存活满1年的可能性。,死亡概率(probability of death),表示某时段开始存活的个体,在该时段内死亡的可能性; 年死亡概率表示年初尚存人口在今后1年内死亡的可能性。,指观察对象经历t个单位时段后仍存活的可能性。,生存率 (survival rate, survival function ),生存概率和生存率的计算,例:手术治疗100例食管癌患者,术后1、2、3年的死亡数分
8、别为10、20、30,若无截尾数据,试求各年生存概率及生存率。,生存概率的计算,第1年生存概率= 第2年生存概率= 第3年生存概率=,生存率的计算,生存率计算方法: 直接法 概率乘法定理 3年生存率 直接法= 概率乘法=0.90.890.875=0.701,由例子可看出,生存率与生存概率不同。生存概率是单个时段的结果,而生存率实质上是累积生存概率(cumulative probability of survival),是多个时段的累积结果。 例如,3年生存率是第1年存活,第2年 也存活,第3年还存活的可能性。,生存概率与生存率的区别,生存概率与生存率的区别,生存概率用p表示,生存率用s(t)表
9、示; 如果数据中无删失,生存率可用下式计算 如果有删失数据,则需分段计算不同单位时间的生存概率pi(i=1,2,t),然后利用概率乘法原理将pi相乘得到t时刻生存率,即,以观察(随访)时间为横轴,以生存率 为纵轴,将各个时间点所对应的生存率 连接在一起的曲线图。 生存曲线是一条下降的曲线,分析时 应注意曲线的高度和下降的坡度。平缓 的生存曲线表示高生存率或较长生存 期,陡峭的生存曲线表示低生存率或较 短生存期。,生存曲线(survival curve),例 某医师收集20例脑瘤患者甲、乙两疗法治疗的生存时间(周)如下: 甲疗法组 1 3 3 7 10 15 15 23 30 乙疗法组 5 7+
10、 13 13 23 30 30+ 38 42 42 45+ 绘制生存曲线,中位生存期(median survival time),又称半数生存期,表示恰好有50的个体尚存活的时间。 中位生存期越长,表示疾病的预后越好;中位生存期越短,预后越差。 估计中位生存期常用图解法或线性内插法。,中位生存时间恰有50的个体存活的中位生存期在19.1623.77之间, 用内插法计算为 即有50的患者在有巩固治疗的情况下,生存不足两年。,第三节 生存率的点估计和区间估计,小样本、未分组资料可用非参数法乘积-极限法(KaplanMeier)估计生存率。 大样本、分组资料可用寿命表法(life table met
11、hod)估计生存率的估计。,小样本、未分组资料 乘积-极限法估计生存率,乘积-极限法(product-limit method,简称PL法)由Kaplan和Meier于1958年首先提出,故又称Kaplan-Meier法或K-M法。,例14-2 某医师对14例缓解后的急性淋巴细胞性白血病患者继续进行巩固治疗,记录患者缓解到死亡的生存时间(月)分别为: 7.67 7.67 8.33 13.16 13.16 19.16 19.16+ 20.17+ 20.17+ 23.77 26.00 26.00 66.83 73.57+, 试估计其生存率。,1.存活时间排序 将不同生存时点(i=1、2、3)的生存
12、时间完全数据(ti)按由小到大的顺序排列,生存时间相同者只列一个,截尾数据不参加排序,见表14-2第(1)、(2)栏。 2. 列出死亡例数 列出生存时间的死亡例数(di),见表14-2第(3)栏。,3.列出相邻两生存时间的截尾例数 本例在生存时间19.1623.77有三例截尾数据,分别为19.16+,20.17+,20.17+,故截尾数为3。见表14-2第(4)栏。 4.期初例数 在各时点列出生存时间的病例数(包括该时点的死亡数),即第i时点前病例数,见表14-2第(5)栏。第i时点的期初例数与死亡数和截尾数据的关系为,(14-4),5.按式(14-1)计算条件生存概率 见表14-2第(6)栏
13、。按式(14-2)、(14-3)计算生存率 ,见表14-2第(7)栏。,缓解的急性淋巴细胞性白血病患者在有巩固治疗时的生存率及标准误,中位生存时间恰有50的个体存活的中位生存期在19.1623.77之间, 用内插法计算为 即有50的患者在有巩固治疗的情况下,生存不足两年。,生存率的区间估计,Greenwood生存率标准误近似计算公式 式中 j为完全数据的顺序。假定生存率近似服从正态分布,则总体生存率的(1-)可信区间为,(14-6),(14-5),计算例14-2中的标准误,见表14-2第(8)栏,其中 标准误的计算如下 有巩固治疗的患者生存满13.16月的总体生存率95%可信区间为 0.642
14、91.960.1281(0.3981,0.8940),大样本、分组资料 寿命表法(life table method)估计 生存率,例14-5 收集了226名某恶性肿瘤病人确诊后的随访资料,观察患者的死亡情况,取时间区间均为1年,整理结果见表14-7中第(1)(5)栏,试估计该肿瘤患者确诊后不同年数的生存率。,1.整理原始资料 以确诊日为观察起点,按确诊后年数划分组段,在各组段中,观察对象包含下限,不包含上限; 2.计算期初有效例数 期初有效例数 ,见表14-7第(6)栏。 3.计算条件生存概率 ,见表14-7第(7)栏; 4. 计算生存率、标准误、95%可信区间,公式同PL法,见表14-7第
15、(8)、(9)、(10)栏。,1 2 3 4 5 6 7 8,第四节 生存(率)曲线比较 生存曲线的log-rank检验(对数秩检验(log-rank test) 、时序检验),该检验属非参数检验,用于比较两组或多组生存曲线或生存时间是否相同。,基本思想:是当 成立时,即比较组间总体生存率相等,根据 检验的基本思想,计算每一生存时点上各比较组的理论死亡数。 式中 :第g组第i时点的期初病例数; 、 :第i时点上各比较组合计的死亡数及观察例数。,(14-11),检验统计量为卡方, 检验的统计量为 式中 :各比较组在第i时点上的实际死亡数; :各比较组在第i时点上的理论死亡数。,(14-12),值
展开阅读全文