生存分析课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《生存分析课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生存 分析 课件
- 资源描述:
-
1、11919 生存分析生存分析2回归分析回归分析1个因变量个因变量Y1个自变量个自变量X 2个以上自变量个以上自变量XY是数值是数值变量变量Y是分类是分类型变量型变量两个因变量两个因变量(结局分类变量(结局分类变量+时间)时间)生存分析生存分析Cox回归回归一元回归一元回归Simple regression Logistic 回归回归Logistic regression 多重回归多重回归Multiple regression 常用的回归分析:常用的回归分析:曲线回归线性回归3 主要特点:考虑到了每个研究对象出现某一结局主要特点:考虑到了每个研究对象出现某一结局所经历的时间长短。所经历的时间长短
2、。生存分析生存分析(survival analysis)将将终点事件终点事件和和出现终点时间所经历的时间出现终点时间所经历的时间结结合起来分析的一类统计分析。合起来分析的一类统计分析。4例:例:某医院泌尿外科医师对某医院泌尿外科医师对可能影响膀胱肿瘤术生生可能影响膀胱肿瘤术生生存的因素存的因素进行了调查,选择进行了调查,选择1996-2000年间手术治疗的年间手术治疗的膀胱肿瘤患者膀胱肿瘤患者30例,随访截止日期例,随访截止日期2000年年12月月30日:日:编编号号年龄年龄(岁岁)肿瘤肿瘤分级分级肿瘤大肿瘤大小小/cm是否是否复发复发手术日期手术日期终止观终止观察日期察日期结局结局生存时生存
3、时间间/月月162I3.0002/10/199612/30/2000存活存活59264I3.0003/05/199608/12/2000死于膀胱瘤死于膀胱瘤54 352II3.0104/09/199612/03/1999失访失访44460I3.0006/06/199610/27/2000死于冠心病死于冠心病53559II3.0007/20/199606/21/1998死于膀胱瘤死于膀胱瘤23659I3.0108/19/199609/10/1999死于膀胱瘤死于膀胱瘤37表表19-2 30例膀胱肿瘤患者生存资料的原始记录表例膀胱肿瘤患者生存资料的原始记录表5对缺损数据无法处理。对缺损数据无法处理
4、。Logistic分析的缺陷:分析的缺陷:只考虑终点事件的出现与否。只考虑终点事件的出现与否。但在研究中,还需要考察对象到达终点时所经历但在研究中,还需要考察对象到达终点时所经历时间的长短,也就是说研究者对医学事件发生、发展时间的长短,也就是说研究者对医学事件发生、发展所经历的时间感兴趣。所经历的时间感兴趣。如恶性肿瘤、慢性病等各个观察对象随访各时间如恶性肿瘤、慢性病等各个观察对象随访各时间点的发生情况,以评价临床疗效和控制的好坏。点的发生情况,以评价临床疗效和控制的好坏。生存分析生存分析6u有有结局结局和和生存时间生存时间两个因变量两个因变量;u生存时间分布不正态生存时间分布不正态非负且右偏
5、非负且右偏;u可能含有删失数据(可能含有删失数据(censor)。)。生存资料特点:生存资料特点:生存分析特点:生存分析特点:u同时考虑结局和生存时间两个因变量同时考虑结局和生存时间两个因变量;u可处理生存时间分布不正态的问题;可处理生存时间分布不正态的问题;u可处理删失数据。可处理删失数据。7 生生 存存 分分 析析 19.1 概概 述述 。19.2 生存率的估计生存率的估计 。19.3 生存曲线的比较生存曲线的比较 。19.4 Cox比例风险回归模型比例风险回归模型 819.1 生存分析的概述生存分析的概述9 三要素:三要素:1.生存时间生存时间(survival time)从规定的从规定
6、的观察起点观察起点到某一特定到某一特定终点事终点事件件出现的出现的时间长短时间长短。终点事件终点事件生存时间生存时间 观察起点观察起点生存分析中的基本概念:生存分析中的基本概念:10随机对照临床试验研究:随机对照临床试验研究:观察起点通常是随机化观察起点通常是随机化分组的时间。分组的时间。观察性研究:观察性研究:观察起点观察起点可以是发病时间、第一次可以是发病时间、第一次确诊时间或接受正规治疗的时间;确诊时间或接受正规治疗的时间;终点事件终点事件可以可以是某种疾病发生、某种处理的反应、疾病的复发是某种疾病发生、某种处理的反应、疾病的复发或死亡等。或死亡等。11 终点事件终点事件生存时间 观察起
7、点观察起点 疾病确诊疾病确诊 死亡死亡 痊愈痊愈 死亡死亡 治疗开始治疗开始 复发复发 痊愈痊愈 症状缓解症状缓解 疾病恶化疾病恶化 接触毒物接触毒物 出现毒性反映出现毒性反映 接触危险因素接触危险因素 发病发病观察性研究:观察性研究:12合格的合格的研究对象研究对象 出现结果出现结果 尚未出现结果尚未出现结果 失访、脱落失访、脱落试验组试验组对照组对照组伴随因素伴随因素干扰因素干扰因素随访研究随访研究(follow-up study)示意图示意图随机对象的临床试验研究:随机对象的临床试验研究:13随访研究:随访研究:时时 间间 终点事件终点事件:死于膀胱肿瘤:死于膀胱肿瘤研究截止时点研究截止
8、时点2000/12/30死亡死亡失访失访死于冠心病死于冠心病死亡死亡死亡死亡生存时间生存时间到截止时间事件尚未发生到截止时间事件尚未发生死亡死亡删删 失失14n完全数据完全数据:在规定的观察期内,对某些观察对象观察:在规定的观察期内,对某些观察对象观察到了终点事件发生,从起点到终点事件所经历的时间,到了终点事件发生,从起点到终点事件所经历的时间,称为生存时间的完全数据(称为生存时间的完全数据(complete data)。用符号)。用符号“t”表示。表示。n 删失数据删失数据(截尾数据)(截尾数据):规定的观察期内,对某些:规定的观察期内,对某些观察对象,观察对象,由于某种原因未能观察到病人的
9、终点事件由于某种原因未能观察到病人的终点事件发生,并不知道其确切的生存时间,发生,并不知道其确切的生存时间,就象病人生存时就象病人生存时间在未达到规定的终点就被截尾一样,称为生存时间间在未达到规定的终点就被截尾一样,称为生存时间的删失数据,又称截尾数据,用符号的删失数据,又称截尾数据,用符号“t+”表示。表示。2.生存数据类型:生存数据类型:15产生删失数据的常见原因有:产生删失数据的常见原因有:研究结束时终点事件尚未发生;研究结束时终点事件尚未发生;失访;失访;死于其它原因;死于其它原因;由于严重药物反应而终止观察或改变治疗措施。由于严重药物反应而终止观察或改变治疗措施。16生存分析的特点:
10、生存分析的特点:特点:特点:u同时考虑生存结局和生存时间同时考虑生存结局和生存时间u可能含有删失数据(可能含有删失数据(censor););u生存时间分布不正态生存时间分布不正态非负且右偏。非负且右偏。生存分析生存分析生存资料生存资料u可处理删失数据;可处理删失数据;u可处理生存时间分布不正态的问题。可处理生存时间分布不正态的问题。处理删失处理删失/截尾截尾数据时两种错误的做法:数据时两种错误的做法:错误错误1:只考虑确切数据,丢弃只考虑确切数据,丢弃截尾截尾数据(损失信息);数据(损失信息);错误错误2:将将截尾截尾数据当作确切数据处理(低估了生存时间数据当作确切数据处理(低估了生存时间的平
11、均水平)。的平均水平)。17在处理正偏态分布数据时两种错误的做法:在处理正偏态分布数据时两种错误的做法:错误错误1:采用平均生存时间而不是采用采用平均生存时间而不是采用中位生存时中位生存时间间来表示生存时间的平均水平。来表示生存时间的平均水平。错误错误2:采用常规采用常规 t 检验或方差分析进行组间比较。检验或方差分析进行组间比较。(应采(应采用用log-rank检验检验比较几组生存时间比较几组生存时间)182.生存分析中常用概念:生存分析中常用概念:死亡概率(死亡概率(probability of death););生存概率(生存概率(probability of survival););生
12、存率(生存率(survival rate)及其标准误)及其标准误;中位生存期(中位生存期(median survival time)及四分位间距)及四分位间距;风险函数(风险函数(hazard function):t 时刻存活的个体在时刻存活的个体在t 时时刻的瞬时死亡率。刻的瞬时死亡率。针对单位时间的针对单位时间的19 死亡概率死亡概率(probability of death):表示某单位时):表示某单位时段开始存活的个体,在该时段内死亡的可能性;段开始存活的个体,在该时段内死亡的可能性;如年死亡概率。如年死亡概率。某年年初人口数某年内死亡人数)死亡概率(q注意:如果年内有删失,则分母用校
13、正人口数:注意:如果年内有删失,则分母用校正人口数:校正人口数校正人口数 =年初人口数年初人口数删失例数删失例数/2/2末人口数:末人口数:n-k初人口数:初人口数:n期间死亡人数:期间死亡人数:k20 生存概率生存概率(probability of survival):单位时段开始:单位时段开始 时存活的个体,到该时段结束时仍然存活的可能性。时存活的个体,到该时段结束时仍然存活的可能性。注意:若年内有删失,分母用校正人口数。注意:若年内有删失,分母用校正人口数。qp1某年年初人口数某年活满一年人数)生存概率(末人口数:末人口数:n-k初人口数:初人口数:n期间死亡人数:期间死亡人数:k21
14、生存率生存率(survival rate):0 时刻存活的个体经历时刻存活的个体经历 tk时个单位时间段后仍存活的可能性。时个单位时间段后仍存活的可能性。观察总例数时刻仍存活例数kkttTPtS)()(若资料中无删失数据时:若资料中无删失数据时:22解:解:1.各年生存概率各年生存概率 p1=(5010)/50 =0.80 p2=(4010)/40 =0.75 p3=(3010)/30 =0.67 2.3年生存率年生存率 S(3)=P(T3)=(5030)/50=0.4=p1 p2 p3【举例举例】手术治疗手术治疗50例肺癌病人,术后例肺癌病人,术后1,2,3年的年的 死亡数分别为死亡数分别为
15、10,10,10例,无截尾数据。试求各年例,无截尾数据。试求各年的生存概率和的生存概率和3年生存率。年生存率。23 故生存率又称为故生存率又称为累积生存概率累积生存概率(cumulative probability of survival),它是随着时间的变化而变化,它是随着时间的变化而变化 着的,是关于时间的函数,称为着的,是关于时间的函数,称为生存函数生存函数(survival function)。24若资料中有删失数据,则须分段计算生存概率,再应用若资料中有删失数据,则须分段计算生存概率,再应用概率乘法定理将分时段的生存概率相乘得到生存率:概率乘法定理将分时段的生存概率相乘得到生存率:k
16、kkkkptSppptTPtS)(.)()(121 区分:区分:生存率生存率生存概率生存概率u生存概率是针对单位时间而言的;生存概率是针对单位时间而言的;u生存率是针对某个较长时段的,是生存概率的累计结果。生存率是针对某个较长时段的,是生存概率的累计结果。25生存率的标准误:生存率的标准误:ijttijjjiidnndtStSSE)()()(第第 j 个时间段内死亡人数个时间段内死亡人数第第 j 个时间段期初人口数个时间段期初人口数26生存期的四分位数间距:生存期的四分位数间距:QP75-P25 是反映离散程度大小的指标。是反映离散程度大小的指标。中位生存期中位生存期及及四分位数间距四分位数间
17、距中位生存期中位生存期(median survival time):也称:也称半数生存期半数生存期,是生存时间中位数(是生存时间中位数(M/P50),表示恰有),表示恰有50%的个体存活的个体存活的时间,即生存率为的时间,即生存率为50时对应的生存时间,是描述集中时对应的生存时间,是描述集中趋势的指标。趋势的指标。中位生存期越长,表示疾病的预后越好。中位生存期越长,表示疾病的预后越好。27 风险函数风险函数(hazard function):t 时刻存活的个体在时刻存活的个体在t 时刻的瞬时死亡率时刻的瞬时死亡率。h(t)近似地等于近似地等于t 时刻存活的个体在此后一个单位时时刻存活的个体在此
18、后一个单位时段内的死亡概率段内的死亡概率。ttTttTtPthtlim0)(28生存分析的基本步骤:生存分析的基本步骤:估计生存率(生存函数)估计生存率(生存函数)评价生存时间影响评价生存时间影响因子的效果因子的效果生存时间分布的组间比较生存时间分布的组间比较1.寿命表法寿命表法 2.Kaplan-Meier法法Cox回归模型回归模型Log rank 检验检验2921.2 生存曲线的估计生存曲线的估计30生存率估计生存率估计 或称乘积极限法或称乘积极限法(product limit method)大样本资料:大样本资料:寿命表法寿命表法小样本资料:小样本资料:kaplan-meier法法311
19、9.2.1 寿命表法(寿命表法(life table method)例例21-1 收集收集374名某恶性肿瘤患者的随访资料,取时间区名某恶性肿瘤患者的随访资料,取时间区间均为间均为1年,整理结果见下午表,试估计各年生存率。年,整理结果见下午表,试估计各年生存率。32解析:解析:u该生存资料为大该生存资料为大样本,生存时间粗略且含有删失数据。样本,生存时间粗略且含有删失数据。方法原理:方法原理:1.计算期初有效例数,注意删失数据计算期初有效例数,注意删失数据 期初有效例数期初有效例数=期初病例数期初病例数-期内删失数期内删失数/2 2.计算死亡概率、生存概率计算死亡概率、生存概率 死亡概率死亡概
20、率=期内死亡数期内死亡数/期初有效例数期初有效例数 生存概率生存概率=1-死亡概率死亡概率 3.计算计算生存率生存率。4.作生存曲线。作生存曲线。寿命表法寿命表法33寿命表法寿命表法34寿命表法曲线为折线。该法只估计时段右端点的生存率,省略了时段内的生存率估计。恶性肿瘤患者确诊后恶性肿瘤患者确诊后5 年内生存率下降较快,年内生存率下降较快,5 年后下年后下降较平缓,说明确诊降较平缓,说明确诊5年内该恶性肿瘤患者的死亡威胁较大。年内该恶性肿瘤患者的死亡威胁较大。中位生存期中位生存期35【电脑实现电脑实现】SPSS1.数据录入:数据录入:频数形式频数形式生存分析生存分析寿命表法寿命表法【Time】
21、生存时间(年)生存时间(年)【Status】0:删失数据:删失数据 1:完全数据(死亡):完全数据(死亡)【Freq】频数频数362.加权加权373.SPSS过程过程3839404.结果及结果输出:结果及结果输出:期初病例数期内删失数期初有效例数期内死亡数死亡概率生存概率生存率概率密度 生存率标准误概率密度标准误 风险率 风险率标准误 414219.2.2 乘积极限法乘积极限法kaplan-meier法法例例19-2 按下表数据,按下表数据,14例膀胱肿瘤例膀胱肿瘤3.0cm患者和患者和16例膀胱肿瘤例膀胱肿瘤3.0cm患者的生存时间(月)如下,试估患者的生存时间(月)如下,试估计两组生存率。
22、计两组生存率。3.0cm 14 19 26 28 29 32 36 40 42 44+45 53+54 59+3.0cm67910 11 12 13 20 23 25 27 3034 37 43 5043解析解析:u以以“3.0cm”组为例,组为例,n=14,样本含量较小且含删失样本含量较小且含删失数据。数据。u方法原理:方法原理:1.将生存时间由小到大依次排列,将生存时间由小到大依次排列,2.在每个时间区间上,计算死亡人数、删失人数、期初在每个时间区间上,计算死亡人数、删失人数、期初人数、死亡概率、生存概率和生存率。人数、死亡概率、生存概率和生存率。3.作生存曲线。作生存曲线。乘积极限法乘积
23、极限法kaplan-meier法法44+45Kaplan-Meier法生存曲线为阶梯形曲线。中位生存期中位生存期4619.2.3 生存率的区间估计生存率的区间估计ijttijjjiidnndtStSSE)()()(0 假定标准误近似正态分布,则标准误的假定标准误近似正态分布,则标准误的1-置信区间为:置信区间为:Greenwood法求生存率的近似标准误:法求生存率的近似标准误:)()(2/iitSSEZtS47【电脑实现电脑实现】SPSS1.数据录入数据录入生存分析生存分析Kaplan-Meier【Group】1:3.0cm;2:3.0cm【dtime】生存时间(月)生存时间(月)【Statu
24、s】0:删失数据:删失数据 1:完全数据(结局事件):完全数据(结局事件)482.SPSS过程过程49Case Processing SummaryCase Processing Summary1411321.4%16160.0%3027310.0%group=3.0cmOverallTotal NN of EventsNPercentCensored3.结果及结果输出:结果及结果输出:Survival TableSurvival Table14.000完全.929.06911319.000完全.857.09421226.000完全.786.11031128.000完全.714.1214102
25、9.000完全.643.1285932.000完全.571.1326836.000完全.500.1347740.000完全.429.1328642.000完全.357.1289544.000删失.9445.000完全.268.12310353.000删失.10254.000完全.134.11311159.000删失.1106.000完全.938.0611157.000完全.875.0832149.000完全.813.09831310.000完全.750.10841211.000完全.688.11651112.000完全.625.12161013.000完全.563.1247920.000完全.
展开阅读全文