书签 分享 收藏 举报 版权申诉 / 115
上传文档赚钱

类型大学精品课件:医学随访资料的生存分析115.ppt

  • 上传人(卖家):金钥匙文档
  • 文档编号:432968
  • 上传时间:2020-04-04
  • 格式:PPT
  • 页数:115
  • 大小:3.47MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《大学精品课件:医学随访资料的生存分析115.ppt》由用户(金钥匙文档)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    大学 精品 课件 医学 随访 资料 生存 分析 115
    资源描述:

    1、生存分析 Survival Analysis,To be or not to be is only a part of the question. The question also includes how long to be.,前 言,为了考察某种慢性病的治疗效果或影响预后的因素,需要通过随访(follow up)搜集每个病人从开始治疗到痊愈的时间。对时间资料进行分析,称为生存分析(survival ananlysis),定 义,生存分析(survival analysis)是将事件的结果(终点事件)和出现这一结果所经历的时间结合起来分析的一种统计分析方法。 生存分析不同于其它多因素分析

    2、的主要区别点就是生存分析不仅考虑事件是否出现,而且考虑事件出现的时间长短。因此,也称为事件时间分析(time-to-event ananlysis),例如,某肿瘤医院调查了1991-1995年间经手术治疗的大肠癌患者150例,对可能影响大肠癌术后生存时间的因素进行了调查,如性别、年龄、组织学分类、肿瘤大小、DureS分期等。随访截止日期为2000年12月30日,随访记录见下表。,大肠癌患者的随访记录,生存资料的特点,记录了结局 记录了手术确切的时间和最后一次访问患者的时间。,第一节 生存分析基本概念,起始事件和终点事件 生存时间 生存结局删失 完全数据与不完全数据 生存概率和死亡概率 生存率

    3、生存曲线,起始事件和终点事件,终点事件与起始事件之间的时间间隔。 起始事件是反映研究对象生存过程的起始特征的事件。 终点事件指研究者所关心的特定结局。 终点事件和起始事件是相对而言的,它们都由研究目的决定,须在设计时明确规定,并在研究期间严格遵守,不能随意改变。,起始事件 终点事件 服药 痊愈 手术切除 死亡 染毒 死亡 化疗 缓解 缓解 复发 第一次发病 第二次发病,扩展,生存时间,费用,次数,总公里数,生存结局(status),1. 死亡 感兴趣的终点事件; 删失censoring,也称截尾或终检 删失分为:左删失、区间删失、右删失,数据删失的原因,(1)病人失访:由于病人未继续就诊、拒绝

    4、访问、迁移等失去联系; (2)病人因其它疾病等造成的意外死亡:如观察食管癌病人的生存时间,死于非食管癌的病人,或死于车祸、中毒等; (3)病人因病情加重等,导致治疗方案的改变; (4)至随访研究结束时仍存在的受试对象而被迫终止随访。,生存时间( survival time,failure time ) 从狭义的角度来说:生存时间是患某病的病人从发病到 死亡所经历的时间跨度。,开始发病,病人死亡,t0,tj,Survival Time,从广义的角度:从某种起始事件到达某种终点时间所经历 的时间跨度。,起始事件,终点事件,t0,tj,Survival Time,生存时间的度量单位可以是年、月、日、

    5、小时等。,生存时间数据的类型:,1. 完全数据(complete data) 从起点至死亡(死于所研究疾病)所经历 的时间。常用符号t表示; 2. 不完全数据( incomplete data,删失数据,截尾数据),截尾数据在其右上角标记“+”; 从起点至截尾点所经历的时间,得不到确切的生存时间。 在生存分析研究中,删失值所占的比例不宜太大,且删失的模式应该是随机的。,观察日期 t,观察起点,观察终点,确诊,死亡,截尾,病 人 号,1,2,3,4,90.1.1,92.12.31,95.12.31,t1=2y,t2=4+y,t3=3y,t4=1+y,图1 完全数据与截尾数据,生存时间资料特点,(

    6、1)效应变量有2个:一是生存时间(天数),二是结局(死亡与否、是否阳性等)。 (2)存在截尾数据:有些病人未观察到底,不知他们究竟能活多长时间。,(3)分布类型复杂:生存时间资料常通过随访获得,因观察时间长且难以控制混杂因素,故其分布常呈偏态,影响因素较多,规律难以估测。 生存时间的分布通常不呈正态分布,而呈偏态分布,如呈指数分布、weibull分布、Gompertz分布、对数logistic分布等。 因此,生存时间资料不宜简单地计算死亡率,也不能简单地计算生存时间的平均数,必须将两者结合起来分析才能准确地反映疗效和预后的好坏程度,即必须用生存分析方法作统计分析。,第二节 生存概率、生存率、生

    7、存曲线、生存中位数,生存概率 生存率 生存曲线 生存中位数,生存概率(probability of survival),表示某单位时段开始时存活的个体,到该时段结束时仍存活的可能性。 年生存概率表示年初尚存人口存活满1年的可能性。,死亡概率(probability of death),表示某时段开始存活的个体,在该时段内死亡的可能性; 年死亡概率表示年初尚存人口在今后1年内死亡的可能性。,指观察对象经历t个单位时段后仍存活的可能性。,生存率 (survival rate, survival function ),生存概率和生存率的计算,例:手术治疗100例食管癌患者,术后1、2、3年的死亡数分

    8、别为10、20、30,若无截尾数据,试求各年生存概率及生存率。,生存概率的计算,第1年生存概率= 第2年生存概率= 第3年生存概率=,生存率的计算,生存率计算方法: 直接法 概率乘法定理 3年生存率 直接法= 概率乘法=0.90.890.875=0.701,由例子可看出,生存率与生存概率不同。生存概率是单个时段的结果,而生存率实质上是累积生存概率(cumulative probability of survival),是多个时段的累积结果。 例如,3年生存率是第1年存活,第2年 也存活,第3年还存活的可能性。,生存概率与生存率的区别,生存概率与生存率的区别,生存概率用p表示,生存率用s(t)表

    9、示; 如果数据中无删失,生存率可用下式计算 如果有删失数据,则需分段计算不同单位时间的生存概率pi(i=1,2,t),然后利用概率乘法原理将pi相乘得到t时刻生存率,即,以观察(随访)时间为横轴,以生存率 为纵轴,将各个时间点所对应的生存率 连接在一起的曲线图。 生存曲线是一条下降的曲线,分析时 应注意曲线的高度和下降的坡度。平缓 的生存曲线表示高生存率或较长生存 期,陡峭的生存曲线表示低生存率或较 短生存期。,生存曲线(survival curve),例 某医师收集20例脑瘤患者甲、乙两疗法治疗的生存时间(周)如下: 甲疗法组 1 3 3 7 10 15 15 23 30 乙疗法组 5 7+

    10、 13 13 23 30 30+ 38 42 42 45+ 绘制生存曲线,中位生存期(median survival time),又称半数生存期,表示恰好有50的个体尚存活的时间。 中位生存期越长,表示疾病的预后越好;中位生存期越短,预后越差。 估计中位生存期常用图解法或线性内插法。,中位生存时间恰有50的个体存活的中位生存期在19.1623.77之间, 用内插法计算为 即有50的患者在有巩固治疗的情况下,生存不足两年。,第三节 生存率的点估计和区间估计,小样本、未分组资料可用非参数法乘积-极限法(KaplanMeier)估计生存率。 大样本、分组资料可用寿命表法(life table met

    11、hod)估计生存率的估计。,小样本、未分组资料 乘积-极限法估计生存率,乘积-极限法(product-limit method,简称PL法)由Kaplan和Meier于1958年首先提出,故又称Kaplan-Meier法或K-M法。,例14-2 某医师对14例缓解后的急性淋巴细胞性白血病患者继续进行巩固治疗,记录患者缓解到死亡的生存时间(月)分别为: 7.67 7.67 8.33 13.16 13.16 19.16 19.16+ 20.17+ 20.17+ 23.77 26.00 26.00 66.83 73.57+, 试估计其生存率。,1.存活时间排序 将不同生存时点(i=1、2、3)的生存

    12、时间完全数据(ti)按由小到大的顺序排列,生存时间相同者只列一个,截尾数据不参加排序,见表14-2第(1)、(2)栏。 2. 列出死亡例数 列出生存时间的死亡例数(di),见表14-2第(3)栏。,3.列出相邻两生存时间的截尾例数 本例在生存时间19.1623.77有三例截尾数据,分别为19.16+,20.17+,20.17+,故截尾数为3。见表14-2第(4)栏。 4.期初例数 在各时点列出生存时间的病例数(包括该时点的死亡数),即第i时点前病例数,见表14-2第(5)栏。第i时点的期初例数与死亡数和截尾数据的关系为,(14-4),5.按式(14-1)计算条件生存概率 见表14-2第(6)栏

    13、。按式(14-2)、(14-3)计算生存率 ,见表14-2第(7)栏。,缓解的急性淋巴细胞性白血病患者在有巩固治疗时的生存率及标准误,中位生存时间恰有50的个体存活的中位生存期在19.1623.77之间, 用内插法计算为 即有50的患者在有巩固治疗的情况下,生存不足两年。,生存率的区间估计,Greenwood生存率标准误近似计算公式 式中 j为完全数据的顺序。假定生存率近似服从正态分布,则总体生存率的(1-)可信区间为,(14-6),(14-5),计算例14-2中的标准误,见表14-2第(8)栏,其中 标准误的计算如下 有巩固治疗的患者生存满13.16月的总体生存率95%可信区间为 0.642

    14、91.960.1281(0.3981,0.8940),大样本、分组资料 寿命表法(life table method)估计 生存率,例14-5 收集了226名某恶性肿瘤病人确诊后的随访资料,观察患者的死亡情况,取时间区间均为1年,整理结果见表14-7中第(1)(5)栏,试估计该肿瘤患者确诊后不同年数的生存率。,1.整理原始资料 以确诊日为观察起点,按确诊后年数划分组段,在各组段中,观察对象包含下限,不包含上限; 2.计算期初有效例数 期初有效例数 ,见表14-7第(6)栏。 3.计算条件生存概率 ,见表14-7第(7)栏; 4. 计算生存率、标准误、95%可信区间,公式同PL法,见表14-7第

    15、(8)、(9)、(10)栏。,1 2 3 4 5 6 7 8,第四节 生存(率)曲线比较 生存曲线的log-rank检验(对数秩检验(log-rank test) 、时序检验),该检验属非参数检验,用于比较两组或多组生存曲线或生存时间是否相同。,基本思想:是当 成立时,即比较组间总体生存率相等,根据 检验的基本思想,计算每一生存时点上各比较组的理论死亡数。 式中 :第g组第i时点的期初病例数; 、 :第i时点上各比较组合计的死亡数及观察例数。,(14-11),检验统计量为卡方, 检验的统计量为 式中 :各比较组在第i时点上的实际死亡数; :各比较组在第i时点上的理论死亡数。,(14-12),值

    16、近似服从自由度为(比较组数-1)的分布。 自由度=组数-1。 P0.05,两组或多组生存曲线不同。 P0.05,两组或多组生存曲线差别无统计学意义。,例14-3 就例14-2的资料,再增加13例无巩固治疗患者的生存时间(月)分别为3.40 4.00 4.00 4.20 4.20 5.27 7.53 7.53 7.67 11.77 11.77 13.16 23.77, 试比较有无巩固治疗患者的生存率是否有差异?,出院后月数 0 6 12 18 24 30 36 42-4 合计,注意,以上介绍的是log-rank检验的近似法,计算简便,但其结果较精确法(一般统计软件中输出精确法计算结果)保守。 近

    17、似法: (手工) 精确法: (软件),此检验比较两组或多组生存曲线,实为一单因素分析。 要求各组生存曲线不能交叉,如交叉提示存在混杂因素,应采用分层分析方法或多因素方法来校正混杂因素。 当假设检验有统计意义时,可从以下几方面来评价各组效应大小:生存曲线图目测判断、中位生存期比较等。,log-rank检验用于整条生存曲线的比较,若比较两组某时间点处的生存率,则按下式计算: 如比较多个时间点处生存率,检验水准应取Bonferroni校正,即 ,其中k为比较的次数,以保证总的I型错误概率不超过 。,第五节 Cox比例风险回归模型,Cox比例风险回归模型 (Coxs proportional haza

    18、rds regression model),简称Cox回归模型。 该模型由英国统计学家D.R.Cox于1972年提出,主要用于肿瘤和其它慢性病的预后分析,也可用于队列研究的病因探索。其优点: 多因素分析方法 不考虑生存时间分布 利用截尾数据,一、Cox模型的基本形式,h(t,X)t时刻风险函数、风险率或瞬时死亡 率(hazard function)。 h0(t)基准风险函数,即所有变量都取0时t 时刻风险函数。 X1、X2、Xp协变量、影响因素、预后 因素。 1、 2、 p回归系数。,0,RR1,说明变量X增加时,危险率增加,即X是危险因素。 0,RR1,说明变量X增加时,危险率下降,即X是保

    19、护因素。 =0,RR=1,说明变量X增加时,危险率不变,即X是危险无关因素。,二、参数估计与假设检验,(一)参数估计 最大似然法 (二)假设检验 似然比检验(likelihood ratio test) 得分检验( score test) Wald检验(Wald test),三、因素筛选与最优模型的建立,变量筛选方法 向前引入法(前进法)Forward 向后剔除法(后退法)Backward 逐步引入-剔除法(逐步法)Stepwise,检验水准 初步的、探索性的研究,或变量数较少时,可取0.10。 设计严谨的、证实性的研究,或变量数较多时,可取0.05或0.01 。 检验水准包括引入的检验水准和

    20、剔除的检验水准。一般地,剔除引入。,四、分析结果(结果解释),与生存相关的因素 因素作用大小及方向:保护因素还是危险因素、相对危险度的大小。 因素作用大小排序:标准化回归系数的绝对值。,为探讨某恶性肿瘤的预后,某研究者收集了63例患者的生存时间、生存结局及影响因素。影响因素包括病人年龄、性别、组织学类型、治疗方式、淋巴结转移、肿瘤浸润程度,生存时间以月计算。变量的赋值和所收集的资料分别见表17-8和表17-9。试用Cox回归模型进行分析。,表17-8 某恶性肿瘤的影响因素与赋值,表17-9 63名某恶性肿瘤患者的生存时间(月)及影响因素,分析结果(结果解释),个体的预后指数及预后分组: 预后指

    21、数(prognostic index,PI) = 预后指数越小,预后越好; 预后指数越大,预后越差。,分析结果(结果解释),例如: 传统治疗方式,淋巴结转移,PI2.6929 传统治疗方式,淋巴结无转移,PI1.7616 新治疗方式,淋巴结转移,PI0.9313 新治疗方式,淋巴结无转移,PI0 据PI的大小可将病人分为不同的危险组,常见分三组(即低危组、中危组、高危组)或五组。绘制分组的生存曲线,直观比较各危险组的生存情况,如中位生存期、t年生存率等。,六、Cox模型的注意事项及应用范围,(一)注意事项 设计阶段应注意的问题 模型配合时应注意的问题 应用条件:除生存资料的基本要求外,还要求因

    22、素对生存时间的作用不随时间变化(比例风险假定)。如观察年限超过10年时,癌症手术后放疗的治疗作用可能逐渐消失,从而不满足这一要求。,因素分析时应注意的问题 筛选变量时,考虑该指标是否容易收集、是否费用较高等临床因素。 对连续变量,看其分布,如服从偏态分布,一般进行对数变换后参与计算。,选入模型的变量是统计学上的有关变量,不一定都与生存时间有因果关系。其中某些变量可能只是伴随关系而已,未选入模型的变量不一定全是无关变量,要考虑是否模型内的某些变量代替了它的作用,或因例数不够,或试验中对该变量进行了控制而引起。,检查可能的交互作用项是否显著(方法:一次引入一个交互作用项,看其对应的回归系数是否为0

    23、)。 模型拟合优度考察:据预后指数PI分组,比较各组基于Cox模型的生存曲线与基于kaplan-Meier法估计的生存曲线,如两组曲线吻合较好,表明Cox模型拟合较好。 生存率分析:生存曲线不能随意延长,也不能轻易用于预测预报,经过大量研究所得的生存曲线才有可能推广应用。,(二)适用范围,因素分析 logistic回归模型可以作多因素分析,并可进行 相对危险度估计,但不考虑生存时间的长短, 不能处理随访中常见的截尾数据。Cox比例风 险回归模型具有logistic回归模型的所有优点; 同时考虑生存结局和生存时间的长短,可处理 截尾数据;且不考虑基准风险的分布。 生存预测,强调设计的重要性 专业

    24、知识角度:选择疾病种类、终点事件、影响因素及结果的专业解释等。 统计学角度:样本例数、因素的赋值、生存时间准确到天数、因素筛选方法、结果的统计学解释等。,小结(论文报告中应写明),1材料与方法 病例来源、起始事件、终点事件、观察终止时间、截尾情况、随访结果的获得方法,样本含量、截尾例数及百分比(%)。 建立数据库方法 统计学处理方法 Kaplan-Meier法估计生存率 log-rank检验进行组间生存率比较 Cox模型进行多因素分析,2结果 估计:Kaplan-Meier生存率及生存曲线。 比较:log-rank检验卡方值及其P值。 因素分析及预测: 变量赋值(数量化方法)表 变量统计描述:

    25、 各组病例数和构成比(分类变量) 均数和标准差(数值变量) 变量筛选方法及检验水准 Cox回归结果及统计解释,Cox回归与多元线性回归、logistic回归的比较,案例分析,某研究者观察了确诊后采取同样方案进行化疗 的26例急性混合型白血病患者,欲了解某种不 良染色体是否会影响患者病情的缓解,将治疗 后120天内症状是否缓解作为结果变量(缓解 0;未缓解1),有无不良染色体作为研究 因素。整理资料见下表。,有无不良染色体与缓解的关系 不良染色体 缓解 未缓解 合计 缓解率() 有 5 13 18 27.8 无 3 5 8 37.5 合 计 8 18 26 30.8 考虑到例数较小,采用Fish

    26、er确切概率法,得到P0.667,尚不能认为不良染色体影响病情的缓解。,这种情况下的结果并不可靠,原因是两个比较组之间其它影响患者病情缓解的因素不一定均衡,因而需要考虑平衡其它可能的影响因素如年龄(岁)、骨髓原幼细胞分组(501;500)、CD34表达(阳性1;阴性0)、性别(男1;女0)的作用。,多因素logistic回归分析结果 因素 回归系数 Wald卡方 P OR 染色体 1.457 1.161 0.281 4.29 骨髓原幼 2.961 4.778 0.029 19.2 细胞分组 采用多因素logistic回归分析,经逐步法按0.10水准,平衡骨髓原幼细胞分组后,有无不良染色体不影响

    27、患者的缓解(P0.281)。,有一位临床医生指出,仅考虑是否缓解还不够,如果进一步利用缓解时间的长短来进行分析,信息利用得更充分。 费了很大辛苦,幸好查到了所有患者的缓解时间,于是采用log-rank检验比较有无不良染色体两组病人的生存曲线,得卡方1.28,P0.2579,仍然显示患者的缓解时间与不良染色体无关。,生存时间的比较仍然需要考虑组间的可比性,经多因素Cox回归分析,当检验水准0.10时的结果如下。 因素 回归系数 卡方 P RR 染色体 1.838 3.709 0.054 6.29 CD34 1.877 8.904 0.003 6.54 骨髓原幼 3.205 8.838 0.003

    28、 24.4 细胞分组,Thank You!,生存资料统计学处理方法,(一)设计 目的:专业目的:据专业知识确定。 统计学目的: 估计:根据样本生存资料估计总体生存率及其它有关指标(如中位生存期等),如根据脑瘤患者治疗后的生存时间资料,估计不同时间的生存率、生存曲线以及中位生存期等。 比较:对不同处理组生存率进行比较,如比较不同疗法治疗脑瘤的生存率,以了解哪种治疗方案较优。,影响因素分析:目的是为了探索和了解影响生存时间长短的因素,或平衡某些因素影响后,研究某个或某些因素对生存率的影响。如为改善脑瘤病人的预后,应了解影响病人预后的主要因素,包括病人的年龄、性别、病程、肿瘤分期、治疗方案等。 预测

    29、:具有不同因素水平的个体生存预测,如根据脑瘤病人的年龄、性别、病程、肿瘤分期、治疗方案等预测该病人t年(月)生存率。,方法:前瞻性队列研究 回顾性队列研究 确定起始事件、终点事件、随访终止日期、生存时间、截尾。 确定可能的影响因素、水平以及量化方法。,大肠癌影响因素量化表,大肠癌影响因素量化表,设计调查表:一览表:因素较少时。 单一表:因素较多时。 调查表中应包括 可能的影响因素 观察起点和终点(年、月、日) 生存时间 生存结局 样本含量:非截尾例数至少是可能影响因素的10倍。,三联体数据,(二)搜集资料 可能的影响因素: 从病历获得。 生存时间及结局: 短期可观察到的结局可从病历获得; 长期

    30、结局一般不能从病历直接获得,通过信访、电话等得到。,(三)整理资料 认真检查、核对原始数据,包括影响因素、生存时间和生存结局。 尽量避免缺失值。 建立数据库 FoxBase、Foxpro、Virual Foxpro等专业数据库 统计软件数据库(SAS、SPSS等) Office办公软件中的Excel、Access,大肠癌生存资料 序号 X1 X2 X3 X4 X5 X6 X7 Time Event 1 0 2 1 0 0 1 0 2896 0 2 0 2 1 0 0 1 0 992 1 3 1 2 1 1 0 0 0 2811 0 4 0 3 1 1 0 1 0 2052 1 5 1 2 0 1 0 0 0 2975 0 6 1 2 1 1 1 1 1 856 1 65 0 1 1 1 1 0 0 584 1,生存资料基本要求,样本由随机抽样方法获得,要有一定的数量。 死亡例数不能太少。 截尾比例不能太大。 生存时间尽可能准确。因为常用的生存分析方法都在生存时间排序的基础上作统计处理,即使是小小的舍入误差,也可能改变生存时间顺序而影响结果。 缺项应尽量补齐。,(四)分析资料 估计: Kaplan- Meier法,寿命表法 比较: log-rank检验 影响因素分析:Cox比例风险回归模型(Cox回归模型),是生存分析中最重要的模型之一。 预测: Cox回归模型预测生存率。,

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:大学精品课件:医学随访资料的生存分析115.ppt
    链接地址:https://www.163wenku.com/p-432968.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库