书签 分享 收藏 举报 版权申诉 / 91
上传文档赚钱

类型生存分析课件.ppt

  • 上传人(卖家):晟晟文业
  • 文档编号:4739030
  • 上传时间:2023-01-06
  • 格式:PPT
  • 页数:91
  • 大小:4.56MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《生存分析课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    生存 分析 课件
    资源描述:

    1、11919 生存分析生存分析2回归分析回归分析1个因变量个因变量Y1个自变量个自变量X 2个以上自变量个以上自变量XY是数值是数值变量变量Y是分类是分类型变量型变量两个因变量两个因变量(结局分类变量(结局分类变量+时间)时间)生存分析生存分析Cox回归回归一元回归一元回归Simple regression Logistic 回归回归Logistic regression 多重回归多重回归Multiple regression 常用的回归分析:常用的回归分析:曲线回归线性回归3 主要特点:考虑到了每个研究对象出现某一结局主要特点:考虑到了每个研究对象出现某一结局所经历的时间长短。所经历的时间长短

    2、。生存分析生存分析(survival analysis)将将终点事件终点事件和和出现终点时间所经历的时间出现终点时间所经历的时间结结合起来分析的一类统计分析。合起来分析的一类统计分析。4例:例:某医院泌尿外科医师对某医院泌尿外科医师对可能影响膀胱肿瘤术生生可能影响膀胱肿瘤术生生存的因素存的因素进行了调查,选择进行了调查,选择1996-2000年间手术治疗的年间手术治疗的膀胱肿瘤患者膀胱肿瘤患者30例,随访截止日期例,随访截止日期2000年年12月月30日:日:编编号号年龄年龄(岁岁)肿瘤肿瘤分级分级肿瘤大肿瘤大小小/cm是否是否复发复发手术日期手术日期终止观终止观察日期察日期结局结局生存时生存

    3、时间间/月月162I3.0002/10/199612/30/2000存活存活59264I3.0003/05/199608/12/2000死于膀胱瘤死于膀胱瘤54 352II3.0104/09/199612/03/1999失访失访44460I3.0006/06/199610/27/2000死于冠心病死于冠心病53559II3.0007/20/199606/21/1998死于膀胱瘤死于膀胱瘤23659I3.0108/19/199609/10/1999死于膀胱瘤死于膀胱瘤37表表19-2 30例膀胱肿瘤患者生存资料的原始记录表例膀胱肿瘤患者生存资料的原始记录表5对缺损数据无法处理。对缺损数据无法处理

    4、。Logistic分析的缺陷:分析的缺陷:只考虑终点事件的出现与否。只考虑终点事件的出现与否。但在研究中,还需要考察对象到达终点时所经历但在研究中,还需要考察对象到达终点时所经历时间的长短,也就是说研究者对医学事件发生、发展时间的长短,也就是说研究者对医学事件发生、发展所经历的时间感兴趣。所经历的时间感兴趣。如恶性肿瘤、慢性病等各个观察对象随访各时间如恶性肿瘤、慢性病等各个观察对象随访各时间点的发生情况,以评价临床疗效和控制的好坏。点的发生情况,以评价临床疗效和控制的好坏。生存分析生存分析6u有有结局结局和和生存时间生存时间两个因变量两个因变量;u生存时间分布不正态生存时间分布不正态非负且右偏

    5、非负且右偏;u可能含有删失数据(可能含有删失数据(censor)。)。生存资料特点:生存资料特点:生存分析特点:生存分析特点:u同时考虑结局和生存时间两个因变量同时考虑结局和生存时间两个因变量;u可处理生存时间分布不正态的问题;可处理生存时间分布不正态的问题;u可处理删失数据。可处理删失数据。7 生生 存存 分分 析析 19.1 概概 述述 。19.2 生存率的估计生存率的估计 。19.3 生存曲线的比较生存曲线的比较 。19.4 Cox比例风险回归模型比例风险回归模型 819.1 生存分析的概述生存分析的概述9 三要素:三要素:1.生存时间生存时间(survival time)从规定的从规定

    6、的观察起点观察起点到某一特定到某一特定终点事终点事件件出现的出现的时间长短时间长短。终点事件终点事件生存时间生存时间 观察起点观察起点生存分析中的基本概念:生存分析中的基本概念:10随机对照临床试验研究:随机对照临床试验研究:观察起点通常是随机化观察起点通常是随机化分组的时间。分组的时间。观察性研究:观察性研究:观察起点观察起点可以是发病时间、第一次可以是发病时间、第一次确诊时间或接受正规治疗的时间;确诊时间或接受正规治疗的时间;终点事件终点事件可以可以是某种疾病发生、某种处理的反应、疾病的复发是某种疾病发生、某种处理的反应、疾病的复发或死亡等。或死亡等。11 终点事件终点事件生存时间 观察起

    7、点观察起点 疾病确诊疾病确诊 死亡死亡 痊愈痊愈 死亡死亡 治疗开始治疗开始 复发复发 痊愈痊愈 症状缓解症状缓解 疾病恶化疾病恶化 接触毒物接触毒物 出现毒性反映出现毒性反映 接触危险因素接触危险因素 发病发病观察性研究:观察性研究:12合格的合格的研究对象研究对象 出现结果出现结果 尚未出现结果尚未出现结果 失访、脱落失访、脱落试验组试验组对照组对照组伴随因素伴随因素干扰因素干扰因素随访研究随访研究(follow-up study)示意图示意图随机对象的临床试验研究:随机对象的临床试验研究:13随访研究:随访研究:时时 间间 终点事件终点事件:死于膀胱肿瘤:死于膀胱肿瘤研究截止时点研究截止

    8、时点2000/12/30死亡死亡失访失访死于冠心病死于冠心病死亡死亡死亡死亡生存时间生存时间到截止时间事件尚未发生到截止时间事件尚未发生死亡死亡删删 失失14n完全数据完全数据:在规定的观察期内,对某些观察对象观察:在规定的观察期内,对某些观察对象观察到了终点事件发生,从起点到终点事件所经历的时间,到了终点事件发生,从起点到终点事件所经历的时间,称为生存时间的完全数据(称为生存时间的完全数据(complete data)。用符号)。用符号“t”表示。表示。n 删失数据删失数据(截尾数据)(截尾数据):规定的观察期内,对某些:规定的观察期内,对某些观察对象,观察对象,由于某种原因未能观察到病人的

    9、终点事件由于某种原因未能观察到病人的终点事件发生,并不知道其确切的生存时间,发生,并不知道其确切的生存时间,就象病人生存时就象病人生存时间在未达到规定的终点就被截尾一样,称为生存时间间在未达到规定的终点就被截尾一样,称为生存时间的删失数据,又称截尾数据,用符号的删失数据,又称截尾数据,用符号“t+”表示。表示。2.生存数据类型:生存数据类型:15产生删失数据的常见原因有:产生删失数据的常见原因有:研究结束时终点事件尚未发生;研究结束时终点事件尚未发生;失访;失访;死于其它原因;死于其它原因;由于严重药物反应而终止观察或改变治疗措施。由于严重药物反应而终止观察或改变治疗措施。16生存分析的特点:

    10、生存分析的特点:特点:特点:u同时考虑生存结局和生存时间同时考虑生存结局和生存时间u可能含有删失数据(可能含有删失数据(censor););u生存时间分布不正态生存时间分布不正态非负且右偏。非负且右偏。生存分析生存分析生存资料生存资料u可处理删失数据;可处理删失数据;u可处理生存时间分布不正态的问题。可处理生存时间分布不正态的问题。处理删失处理删失/截尾截尾数据时两种错误的做法:数据时两种错误的做法:错误错误1:只考虑确切数据,丢弃只考虑确切数据,丢弃截尾截尾数据(损失信息);数据(损失信息);错误错误2:将将截尾截尾数据当作确切数据处理(低估了生存时间数据当作确切数据处理(低估了生存时间的平

    11、均水平)。的平均水平)。17在处理正偏态分布数据时两种错误的做法:在处理正偏态分布数据时两种错误的做法:错误错误1:采用平均生存时间而不是采用采用平均生存时间而不是采用中位生存时中位生存时间间来表示生存时间的平均水平。来表示生存时间的平均水平。错误错误2:采用常规采用常规 t 检验或方差分析进行组间比较。检验或方差分析进行组间比较。(应采(应采用用log-rank检验检验比较几组生存时间比较几组生存时间)182.生存分析中常用概念:生存分析中常用概念:死亡概率(死亡概率(probability of death););生存概率(生存概率(probability of survival););生

    12、存率(生存率(survival rate)及其标准误)及其标准误;中位生存期(中位生存期(median survival time)及四分位间距)及四分位间距;风险函数(风险函数(hazard function):t 时刻存活的个体在时刻存活的个体在t 时时刻的瞬时死亡率。刻的瞬时死亡率。针对单位时间的针对单位时间的19 死亡概率死亡概率(probability of death):表示某单位时):表示某单位时段开始存活的个体,在该时段内死亡的可能性;段开始存活的个体,在该时段内死亡的可能性;如年死亡概率。如年死亡概率。某年年初人口数某年内死亡人数)死亡概率(q注意:如果年内有删失,则分母用校

    13、正人口数:注意:如果年内有删失,则分母用校正人口数:校正人口数校正人口数 =年初人口数年初人口数删失例数删失例数/2/2末人口数:末人口数:n-k初人口数:初人口数:n期间死亡人数:期间死亡人数:k20 生存概率生存概率(probability of survival):单位时段开始:单位时段开始 时存活的个体,到该时段结束时仍然存活的可能性。时存活的个体,到该时段结束时仍然存活的可能性。注意:若年内有删失,分母用校正人口数。注意:若年内有删失,分母用校正人口数。qp1某年年初人口数某年活满一年人数)生存概率(末人口数:末人口数:n-k初人口数:初人口数:n期间死亡人数:期间死亡人数:k21

    14、生存率生存率(survival rate):0 时刻存活的个体经历时刻存活的个体经历 tk时个单位时间段后仍存活的可能性。时个单位时间段后仍存活的可能性。观察总例数时刻仍存活例数kkttTPtS)()(若资料中无删失数据时:若资料中无删失数据时:22解:解:1.各年生存概率各年生存概率 p1=(5010)/50 =0.80 p2=(4010)/40 =0.75 p3=(3010)/30 =0.67 2.3年生存率年生存率 S(3)=P(T3)=(5030)/50=0.4=p1 p2 p3【举例举例】手术治疗手术治疗50例肺癌病人,术后例肺癌病人,术后1,2,3年的年的 死亡数分别为死亡数分别为

    15、10,10,10例,无截尾数据。试求各年例,无截尾数据。试求各年的生存概率和的生存概率和3年生存率。年生存率。23 故生存率又称为故生存率又称为累积生存概率累积生存概率(cumulative probability of survival),它是随着时间的变化而变化,它是随着时间的变化而变化 着的,是关于时间的函数,称为着的,是关于时间的函数,称为生存函数生存函数(survival function)。24若资料中有删失数据,则须分段计算生存概率,再应用若资料中有删失数据,则须分段计算生存概率,再应用概率乘法定理将分时段的生存概率相乘得到生存率:概率乘法定理将分时段的生存概率相乘得到生存率:k

    16、kkkkptSppptTPtS)(.)()(121 区分:区分:生存率生存率生存概率生存概率u生存概率是针对单位时间而言的;生存概率是针对单位时间而言的;u生存率是针对某个较长时段的,是生存概率的累计结果。生存率是针对某个较长时段的,是生存概率的累计结果。25生存率的标准误:生存率的标准误:ijttijjjiidnndtStSSE)()()(第第 j 个时间段内死亡人数个时间段内死亡人数第第 j 个时间段期初人口数个时间段期初人口数26生存期的四分位数间距:生存期的四分位数间距:QP75-P25 是反映离散程度大小的指标。是反映离散程度大小的指标。中位生存期中位生存期及及四分位数间距四分位数间

    17、距中位生存期中位生存期(median survival time):也称:也称半数生存期半数生存期,是生存时间中位数(是生存时间中位数(M/P50),表示恰有),表示恰有50%的个体存活的个体存活的时间,即生存率为的时间,即生存率为50时对应的生存时间,是描述集中时对应的生存时间,是描述集中趋势的指标。趋势的指标。中位生存期越长,表示疾病的预后越好。中位生存期越长,表示疾病的预后越好。27 风险函数风险函数(hazard function):t 时刻存活的个体在时刻存活的个体在t 时刻的瞬时死亡率时刻的瞬时死亡率。h(t)近似地等于近似地等于t 时刻存活的个体在此后一个单位时时刻存活的个体在此

    18、后一个单位时段内的死亡概率段内的死亡概率。ttTttTtPthtlim0)(28生存分析的基本步骤:生存分析的基本步骤:估计生存率(生存函数)估计生存率(生存函数)评价生存时间影响评价生存时间影响因子的效果因子的效果生存时间分布的组间比较生存时间分布的组间比较1.寿命表法寿命表法 2.Kaplan-Meier法法Cox回归模型回归模型Log rank 检验检验2921.2 生存曲线的估计生存曲线的估计30生存率估计生存率估计 或称乘积极限法或称乘积极限法(product limit method)大样本资料:大样本资料:寿命表法寿命表法小样本资料:小样本资料:kaplan-meier法法311

    19、9.2.1 寿命表法(寿命表法(life table method)例例21-1 收集收集374名某恶性肿瘤患者的随访资料,取时间区名某恶性肿瘤患者的随访资料,取时间区间均为间均为1年,整理结果见下午表,试估计各年生存率。年,整理结果见下午表,试估计各年生存率。32解析:解析:u该生存资料为大该生存资料为大样本,生存时间粗略且含有删失数据。样本,生存时间粗略且含有删失数据。方法原理:方法原理:1.计算期初有效例数,注意删失数据计算期初有效例数,注意删失数据 期初有效例数期初有效例数=期初病例数期初病例数-期内删失数期内删失数/2 2.计算死亡概率、生存概率计算死亡概率、生存概率 死亡概率死亡概

    20、率=期内死亡数期内死亡数/期初有效例数期初有效例数 生存概率生存概率=1-死亡概率死亡概率 3.计算计算生存率生存率。4.作生存曲线。作生存曲线。寿命表法寿命表法33寿命表法寿命表法34寿命表法曲线为折线。该法只估计时段右端点的生存率,省略了时段内的生存率估计。恶性肿瘤患者确诊后恶性肿瘤患者确诊后5 年内生存率下降较快,年内生存率下降较快,5 年后下年后下降较平缓,说明确诊降较平缓,说明确诊5年内该恶性肿瘤患者的死亡威胁较大。年内该恶性肿瘤患者的死亡威胁较大。中位生存期中位生存期35【电脑实现电脑实现】SPSS1.数据录入:数据录入:频数形式频数形式生存分析生存分析寿命表法寿命表法【Time】

    21、生存时间(年)生存时间(年)【Status】0:删失数据:删失数据 1:完全数据(死亡):完全数据(死亡)【Freq】频数频数362.加权加权373.SPSS过程过程3839404.结果及结果输出:结果及结果输出:期初病例数期内删失数期初有效例数期内死亡数死亡概率生存概率生存率概率密度 生存率标准误概率密度标准误 风险率 风险率标准误 414219.2.2 乘积极限法乘积极限法kaplan-meier法法例例19-2 按下表数据,按下表数据,14例膀胱肿瘤例膀胱肿瘤3.0cm患者和患者和16例膀胱肿瘤例膀胱肿瘤3.0cm患者的生存时间(月)如下,试估患者的生存时间(月)如下,试估计两组生存率。

    22、计两组生存率。3.0cm 14 19 26 28 29 32 36 40 42 44+45 53+54 59+3.0cm67910 11 12 13 20 23 25 27 3034 37 43 5043解析解析:u以以“3.0cm”组为例,组为例,n=14,样本含量较小且含删失样本含量较小且含删失数据。数据。u方法原理:方法原理:1.将生存时间由小到大依次排列,将生存时间由小到大依次排列,2.在每个时间区间上,计算死亡人数、删失人数、期初在每个时间区间上,计算死亡人数、删失人数、期初人数、死亡概率、生存概率和生存率。人数、死亡概率、生存概率和生存率。3.作生存曲线。作生存曲线。乘积极限法乘积

    23、极限法kaplan-meier法法44+45Kaplan-Meier法生存曲线为阶梯形曲线。中位生存期中位生存期4619.2.3 生存率的区间估计生存率的区间估计ijttijjjiidnndtStSSE)()()(0 假定标准误近似正态分布,则标准误的假定标准误近似正态分布,则标准误的1-置信区间为:置信区间为:Greenwood法求生存率的近似标准误:法求生存率的近似标准误:)()(2/iitSSEZtS47【电脑实现电脑实现】SPSS1.数据录入数据录入生存分析生存分析Kaplan-Meier【Group】1:3.0cm;2:3.0cm【dtime】生存时间(月)生存时间(月)【Statu

    24、s】0:删失数据:删失数据 1:完全数据(结局事件):完全数据(结局事件)482.SPSS过程过程49Case Processing SummaryCase Processing Summary1411321.4%16160.0%3027310.0%group=3.0cmOverallTotal NN of EventsNPercentCensored3.结果及结果输出:结果及结果输出:Survival TableSurvival Table14.000完全.929.06911319.000完全.857.09421226.000完全.786.11031128.000完全.714.1214102

    25、9.000完全.643.1285932.000完全.571.1326836.000完全.500.1347740.000完全.429.1328642.000完全.357.1289544.000删失.9445.000完全.268.12310353.000删失.10254.000完全.134.11311159.000删失.1106.000完全.938.0611157.000完全.875.0832149.000完全.813.09831310.000完全.750.10841211.000完全.688.11651112.000完全.625.12161013.000完全.563.1247920.000完全.

    26、500.1258823.000完全.438.1249725.000完全.375.12110627.000完全.313.11611530.000完全.250.10812434.000完全.188.09813337.000完全.125.08314243.000完全.063.06115150.000完全.000.000160123456789101112131412345678910111213141516group=3.0cmTimeStatusEstimateStd.ErrorCumulative ProportionSurviving at the TimeN ofCumulativeEven

    27、tsN ofRemainingCases50 M Me ea an ns s a an nd d M Me ed di ia an ns s f fo or r S Su ur rv vi iv va al l T Ti im me e38.1523.74030.82245.48236.0007.48321.33350.66722.3133.41015.62828.99720.00010.000.40039.60029.6802.86024.07535.28528.0002.73922.63233.368group=3.0cmOverallEstimateStd.ErrorLower Boun

    28、dUpper Bound95%Confidence IntervalEstimateStd.ErrorLower BoundUpper Bound95%Confidence IntervalMeanaMedianEstimation is limited to the largest survival time if it is censored.a.P Pe er rc ce en nt ti il le es s54.0006.07536.0007.48328.0005.63430.0006.06220.00010.00010.0001.73242.0004.63328.0002.7391

    29、4.0005.652group=3.0cmOverallEstimateStd.ErrorEstimateStd.ErrorEstimateStd.Error25.0%50.0%75.0%Overall ComparisonsOverall Comparisons7.3691.007Log Rank(Mantel-Cox)Chi-SquaredfSig.Test of equality of survival distributions for the different levels ofgroup.515219.3 生存曲线的比较生存曲线的比较 (Log rank 检验)检验)53【例例1

    30、9-3】比较上例中膀胱肿瘤比较上例中膀胱肿瘤3.0cm患者和肿患者和肿瘤瘤3.0cm患者的生存曲线,就总体而言,两个生患者的生存曲线,就总体而言,两个生存函数是否有差别?存函数是否有差别?2两组或多组频率比较两组或多组频率比较 检验?检验?Log-rank检验检验5419.2.2 乘积极限法乘积极限法kaplan-meier法法例例19-2 按下表数据,按下表数据,14例膀胱肿瘤例膀胱肿瘤3.0cm患者和患者和16例膀胱肿瘤例膀胱肿瘤3.0cm患者的生存时间(月)如下,患者的生存时间(月)如下,试估计两组生存率。试估计两组生存率。3.0cm14 19 26 28 29 32 36 40 42

    31、44+45 53+54 59+3.0cm67910 11 12 13 20 23 25 27 3034 37 43 5055检验过程:检验过程:05.0。,;,211210两总体生存曲线不同:即两总体生存曲线相同:tStSHtStSH时间由小到大排序将两组数据统一按生存.156giiiigigiiTtdndnt上的理论死亡数计算各组在时间。和死亡例数两组合计的期初例数以及和死亡例数上的期初例数分别计算两组在时间.3,.24667.030114iigigindnT组别死亡数 未死亡数合计3.0cm组01414 3.0cm组11516合计1293057患者。患者的生存曲线高于肿瘤不同可以认为两条生

    32、存曲线接受拒绝水准,按做出统计结论(计算统计量数和理论死亡总数计算各组的实际死亡总cm0.3cm0.3,05.005.0.6137.74584.9)4584.9165416.17)5416.1711).5.4102222,H,HPTTAggg58Overall ComparisonsOverall Comparisons7.3691.007Log Rank(Mantel-Cox)Chi-SquaredfSig.Test of equality of survival distributions for the different levels ofgroup.59【注意事项注意事项】Log-r

    33、ank检验可用于整条生存曲线的比较,也适用检验可用于整条生存曲线的比较,也适用于寿命表资料及多组生存率间的比较;于寿命表资料及多组生存率间的比较;Log-rank检验属于单因素分析方法,其应用条件是检验属于单因素分析方法,其应用条件是除比较因素外,影响生存率的各混杂因素在不同的除比较因素外,影响生存率的各混杂因素在不同的组间均衡。否则,可采用组间均衡。否则,可采用Cox回归。回归。可计算两组死亡的相对危险度可计算两组死亡的相对危险度(relative ratio,RR)69.25416.17/114584.9/16/2211TATARR肿瘤肿瘤3.0组对肿瘤组对肿瘤3.0组组:意义:肿瘤意义:

    34、肿瘤3.0组的死亡风险是对肿瘤组的死亡风险是对肿瘤3.0组的组的2.69倍。倍。6019.4 Cox比例风险回归模型比例风险回归模型 61举例举例:30例膀胱肿瘤患者的随访记录例膀胱肿瘤患者的随访记录 62几种分析模型用于生存资料分析的缺陷:几种分析模型用于生存资料分析的缺陷:Log-rank检验属于单因素分析法,一次只能分析一检验属于单因素分析法,一次只能分析一个因素,那么对影响因素较多的情况就无法应对。个因素,那么对影响因素较多的情况就无法应对。Logistic回归模型:可以事件的结局(定性资料)为回归模型:可以事件的结局(定性资料)为反应变量,可以解决各因素对结局的影响,但不能反应变量,

    35、可以解决各因素对结局的影响,但不能解决生存期时间长短的问题。解决生存期时间长短的问题。多重线性回归模型,它要反应变量为定量资料,且多重线性回归模型,它要反应变量为定量资料,且服从正态分布,而生存时间通常不呈正态分布。服从正态分布,而生存时间通常不呈正态分布。63Cox回归模型回归模型:是由英国伦敦大学的是由英国伦敦大学的Cox于于1972年提出的,它是一年提出的,它是一种半参数模型;种半参数模型;Cox 模型以模型以生存结局生存结局和和生存时间生存时间为因变量,可同时为因变量,可同时分析众多因素对生存期的影响,分析带有删失数据分析众多因素对生存期的影响,分析带有删失数据的资料,且不要求资料服从

    36、特定的分布类型;的资料,且不要求资料服从特定的分布类型;主要用于研究多个影响因子对生存时间的影响。主要用于研究多个影响因子对生存时间的影响。64风险函数风险函数(hazard function):t 时刻存活的个体在时刻存活的个体在t 时刻的瞬时死亡率时刻的瞬时死亡率。h(t)近似地等于近似地等于t 时刻存活的个体在此后一个单时刻存活的个体在此后一个单位时段内的死亡概率位时段内的死亡概率。ttTttTtPthtlim0)(65Cox模型表达式:模型表达式:).exp()()(22110ppXXXththh(t):表示具有协变量:表示具有协变量X1、X2、Xp的个体在的个体在t 时刻时刻的的风险

    37、函数风险函数,表示,表示t 时刻存活的个体在时刻存活的个体在t 时刻的瞬间死时刻的瞬间死亡率;亡率;h0(t):基准风险函数基准风险函数(baseline hazard)表示当表示当X1=X2=Xp=0时,个体在时,个体在t 时刻的时刻的风险函数风险函数。1、2、p:各协变量所对应的:各协变量所对应的回归系数回归系数。66任两个群体风险函数之比,即风险比任两个群体风险函数之比,即风险比 (risk ratio,RR或或hazard ratio,HR))(.)()(exp).exp()().exp()()()(12221112211022110jPiPjijippjppijiXXXXXXXXXt

    38、hXXXthththRRjjii)(.)()()()(lnln1222111jPiPjijijiXXXXXXththRRjjRRln)exp(jjRR或或67RR值与值与h0(t)无关,也与时间无关,也与时间t 无关,即模型中的无关,即模型中的自变量效应不随时间而改变,所以称为自变量效应不随时间而改变,所以称为比例风险比例风险模型假定模型假定,又称,又称PH假定。假定。j的实际意义:在其他自变量固定不变的条件下,的实际意义:在其他自变量固定不变的条件下,变量变量Xj每增加一个单位所引起的每增加一个单位所引起的风险比的自然对风险比的自然对数数。68Cox回归模型拟合的基本步骤:回归模型拟合的基本

    39、步骤:估计参数:估计参数:0、1、2、i回归方程的假设检验回归方程的假设检验回归方程的统计应用回归方程的统计应用极大似然法极大似然法列出回归方程列出回归方程回归系数的区间估计回归系数的区间估计1.检验整个模型检验整个模型 似然比检验似然比检验2.检验单个自变量检验单个自变量 Wald检验检验).exp()()(22110ppXXXthth69举例:举例:.30例膀胱肿例膀胱肿瘤患者的随访瘤患者的随访记录,试进行记录,试进行患者生存情况患者生存情况的影响因素分的影响因素分析。析。70【电脑实现电脑实现】SPSS1.数据录入数据录入生存分析生存分析Cox analysis712.SPSS过程过程7

    40、23.结果及结果输出:结果及结果输出:relapse0.979size1.078grade680.1exp0thth列出列出Cox回归方程(风险函数表达式)回归方程(风险函数表达式):相对危险度相对危险度73).exp()()(22110ppXXXthth预后指数预后指数(Prognostic indes,PI):其取值越):其取值越 大,则风险函数的取值越大,预后越差。大,则风险函数的取值越大,预后越差。74nCox 回归的基本假定是比例风险假定(回归的基本假定是比例风险假定(PH假假定),即模型中的自变量效应不随时间而改变。定),即模型中的自变量效应不随时间而改变。n只有在满足该假定前提下

    41、,基于此模型的分析只有在满足该假定前提下,基于此模型的分析预测才是可靠有效的;预测才是可靠有效的;nPH假定的判断,最简单的是观察假定的判断,最简单的是观察Kaplan-Meier生存曲线。生存曲线。三、三、Cox 回归中回归中PH假定及判断方法假定及判断方法75Cox 回归中回归中PH假定的判定方法(假定的判定方法(1)76Cox 回归中回归中PH假定的判定方法(假定的判定方法(2)77 19.5 结果报告结果报告78结果报告:结果报告:生存率的估计生存率的估计:报告生存率估计方法、:报告生存率估计方法、生存曲线及中位生存期生存曲线及中位生存期生存曲线比较生存曲线比较:报告生存曲线、生存:报

    42、告生存曲线、生存曲线的比较方法、检验统计量及其曲线的比较方法、检验统计量及其P值。值。影响因素分析影响因素分析:报告变量筛选方法、:报告变量筛选方法、检验水准检验水准、各变量、各变量RR值、值、RR值的值的95%置信区间及其置信区间及其P值。值。79附图:肿瘤附图:肿瘤3.0cm组和组和3.0cm组生存曲线组生存曲线(K-M法)法)以以Kaplan-Meier法估计法估计肿瘤肿瘤3.0cm组和组和3.0cm组组的生存率,生存曲线如图的生存率,生存曲线如图1所示。其结果显示所示。其结果显示:两组:两组中位生存期分别为中位生存期分别为20个月个月和和36个月;经个月;经log-rank检检验,验,

    43、两条两条曲线的差别有统计学意义,曲线的差别有统计学意义,肿瘤肿瘤3.0cm组的生存率高组的生存率高于肿瘤于肿瘤3.0cm组的。组的。,01.0,37.72P结果报告结果报告1:80结果报告结果报告2:膀胱肿瘤死亡的影响因素分析见附表示,经多变量膀胱肿瘤死亡的影响因素分析见附表示,经多变量Cox比例风险回归分析显示,肿瘤分级(比例风险回归分析显示,肿瘤分级(RR=5.367,95%CI 2.54011.340,P0.001)、肿瘤大小()、肿瘤大小(RR=2.939,95%CI 1.1937.242,P0.02),以及是否复发(),以及是否复发(RR=2.662,95%CI 1.0806.560

    44、,P0.05)与死亡有关。)与死亡有关。.81小小 结结生存分析是将终点事件和达到终点事件所经历的时间结合生存分析是将终点事件和达到终点事件所经历的时间结合起来分析的一种统计学方法,可用于生存率的估计、生存起来分析的一种统计学方法,可用于生存率的估计、生存曲线比较、影响因素分析和生存预测。曲线比较、影响因素分析和生存预测。生存曲线的非参数估计方法和寿命表法和生存曲线的非参数估计方法和寿命表法和Kaplan-Meier法,法,前者适用于大样本的分组资料;后者适用于小样本或大样前者适用于大样本的分组资料;后者适用于小样本或大样本未分组资料,两者均利用概率乘积法定理计算生存率。本未分组资料,两者均利

    45、用概率乘积法定理计算生存率。Log-rank检验是两条或多条生存曲线比较的非参数方法之检验是两条或多条生存曲线比较的非参数方法之一,因其能对各组生存曲线作整体比较,实际工作中应用一,因其能对各组生存曲线作整体比较,实际工作中应用研究较多。研究较多。Cox模型属比例风险模型、乘法模型;模型属比例风险模型、乘法模型;Cox可用于影响因素可用于影响因素分析、校正混杂因素后的组间比较以及多因素生存预测。分析、校正混杂因素后的组间比较以及多因素生存预测。82区分多重线性回归、区分多重线性回归、logistic回归和回归和Cox回归的异同。回归的异同。83案 例 分 析案 例 分 析(一一)某医师收集某医

    46、师收集30例肺癌术后患者的生存情况,有例肺癌术后患者的生存情况,有1例例由于电话和地址错误无法随访到患者,他设计了以下由于电话和地址错误无法随访到患者,他设计了以下几种处理方法:几种处理方法:把该病例去掉;把该病例去掉;把这例患者写入把这例患者写入SPSS数据,但末次随访时间空白,让数据,但末次随访时间空白,让SPSS自动去分析;自动去分析;因为某一天(比如因为某一天(比如2006年年9月月1日)想随访这例患者日)想随访这例患者但是没有随访到,所以将末次随访时间写为随访当天但是没有随访到,所以将末次随访时间写为随访当天的日期。另欲分析肺癌术后患者的中位生存期,计算的日期。另欲分析肺癌术后患者的

    47、中位生存期,计算结果为结果为10个月,但是检查原始数据发现,生存时间为个月,但是检查原始数据发现,生存时间为10个月的这个患者一直存活到随访结束,似乎与中位个月的这个患者一直存活到随访结束,似乎与中位生存期的定义相矛盾。生存期的定义相矛盾。.84请问:请问:(1)该医师对这例失访患者的处理是否恰当?为什么?)该医师对这例失访患者的处理是否恰当?为什么?正确的处理方法是什么?正确的处理方法是什么?(2)另有)另有1例患者死于脑梗死,生存分析时应如何处理?例患者死于脑梗死,生存分析时应如何处理?(3)该医师的发现是否与中位生存期的定义相矛盾?)该医师的发现是否与中位生存期的定义相矛盾?为什么?为什

    48、么?.85答案答案:(1 1)该医师对这例失访患者的三种处理都不恰当。应)该医师对这例失访患者的三种处理都不恰当。应作为删失病例,删失生存时间的计算为从手术切作为删失病例,删失生存时间的计算为从手术切除到最后一次随访的时间。除到最后一次随访的时间。(2 2)死于脑梗死的病例同样应当作为删失病例。死于)死于脑梗死的病例同样应当作为删失病例。死于脑梗死的病例应当作删失病例,删失生存时间的脑梗死的病例应当作删失病例,删失生存时间的计算为从手术切除到死于脑梗死的时间。计算为从手术切除到死于脑梗死的时间。(3 3)属于概念不清而产生的怀疑。该医师的发现与中)属于概念不清而产生的怀疑。该医师的发现与中位生

    49、存期的定义并不矛盾,中位生存期不能与个位生存期的定义并不矛盾,中位生存期不能与个体生存时间相体生存时间相混淆。混淆。86案 例 分 析案 例 分 析(二二)评价评价A、B两种治疗方案对某病的治疗效果,两种治疗方案对某病的治疗效果,A组组(group0)12人,人,B组(组(group1)13人。患者分人。患者分组后检查其肾功能(组后检查其肾功能(kidney),功能正常者记为),功能正常者记为0,异,异常者记为常者记为1。治疗后生存时间为。治疗后生存时间为time(天),生存结局(天),生存结局status0表示删失,表示删失,status1表示死亡。表示死亡。.87 甲医师以生存结局为观察指

    50、标,整理得甲医师以生存结局为观察指标,整理得A、B两组死亡情两组死亡情况。考虑到例数较少,采用况。考虑到例数较少,采用Fisher确切概率法,得确切概率法,得P0.097,说明两种治疗方法疗效差别无统计学意义。说明两种治疗方法疗效差别无统计学意义。乙医师以生存时间为观察指标,考虑到肾功能是否异常为乙医师以生存时间为观察指标,考虑到肾功能是否异常为可能混杂因素,采用多重线性回归进行校正混杂因素后的组间可能混杂因素,采用多重线性回归进行校正混杂因素后的组间生存时间比较,说明校正肾功能是否异常后,两种治疗方法疗生存时间比较,说明校正肾功能是否异常后,两种治疗方法疗效差别无统计学意义,与甲的结论一致。

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:生存分析课件.ppt
    链接地址:https://www.163wenku.com/p-4739030.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库