生存分析讲课-PPT课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《生存分析讲课-PPT课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生存 分析 讲课 PPT 课件
- 资源描述:
-
1、生存分析生存分析Survival AnalysisSurvival Analysis 第四军医大学西京医院神经内科 刘学东第一节概述第一节概述第二节生存时间资料的特点第二节生存时间资料的特点第三节小样本生存率的第三节小样本生存率的Kaplan-MeierKaplan-Meier估计估计第四节第四节 大样本生存率的寿命表法估计大样本生存率的寿命表法估计第五节第五节 生存曲线比较的假设检验生存曲线比较的假设检验第六节第六节 CoxCox比例风险回归模型比例风险回归模型第七节第七节 实例分析实例分析 第一节概述第一节概述一一 基本概念基本概念 生存分析:是将事件的生存分析:是将事件的结果结果(终点事
2、件)和出现(终点事件)和出现这一结果所经历的这一结果所经历的时间时间结合起来分析的一种统结合起来分析的一种统计分析方法。计分析方法。二二 特点特点 含有截尾数据含有截尾数据 生存时间一般不呈正态分布生存时间一般不呈正态分布三三 历史历史最早可上溯至十九世纪的死亡寿命表最早可上溯至十九世纪的死亡寿命表现代的生存分析则开始于二十世纪三十年代工业科现代的生存分析则开始于二十世纪三十年代工业科学中的相关应用学中的相关应用二次世界大战:武器装备的可靠性研究,这一研究二次世界大战:武器装备的可靠性研究,这一研究兴趣延续到战后。此时生存分析都集中在参数模型兴趣延续到战后。此时生存分析都集中在参数模型。二十世
3、纪六七十年代:医学研究中大量临床试验的出二十世纪六七十年代:医学研究中大量临床试验的出 现,要求方法学有新的突破,生存分析研究开始转向非现,要求方法学有新的突破,生存分析研究开始转向非参数方法。参数方法。D.R.Cox在在72年提出的比例风险模型为此做出了划时年提出的比例风险模型为此做出了划时代的贡献。代的贡献。现在,生存分析方法的在医学领域得到了广泛的应现在,生存分析方法的在医学领域得到了广泛的应 用,而通过医学研究要求的不断提高。用,而通过医学研究要求的不断提高。四四 主要研究内容主要研究内容 描述生存过程描述生存过程 比较生存时间比较生存时间 分析影响生存时间的因素分析影响生存时间的因素
4、五五 基本方法基本方法1 1 非参数法:不考虑资料的分布形式,只根据样本提供的非参数法:不考虑资料的分布形式,只根据样本提供的 顺序统计量对生存率进行估计,常用有顺序统计量对生存率进行估计,常用有K-MK-M 法、法、Life tableLife table法法2 2 参数法:参数法:假定生存时间服从特定的参数分布,根据已假定生存时间服从特定的参数分布,根据已 知分布特点对影响生存时间的因素进行分析,知分布特点对影响生存时间的因素进行分析,常用有:指数分布法、对数正态回归分析法常用有:指数分布法、对数正态回归分析法3 3 半参数法:兼有参数法和非参数法的特点,分析影响生半参数法:兼有参数法和非
5、参数法的特点,分析影响生 存时间和生存率的因素,常用有存时间和生存率的因素,常用有CoxCox比例风险比例风险 回归模型回归模型第二节第二节 生存时间资料的生存时间资料的特点及描述特点及描述一、起始事件与失效事件一、起始事件与失效事件 起始事件:研究对象生存过程的起始特征事件起始事件:研究对象生存过程的起始特征事件 失效事件失效事件(终点事件、死亡事件终点事件、死亡事件):研究者关心的特定结局:研究者关心的特定结局 相对而言的,都由研究目的决定,失效事件并非一定死相对而言的,都由研究目的决定,失效事件并非一定死 亡,死亡也并非一定发生了失效事件。亡,死亡也并非一定发生了失效事件。分析的基石分析
6、的基石二、生存时间(二、生存时间(survival timesurvival time)任何两个有联系事件之间的时间间隔,用任何两个有联系事件之间的时间间隔,用t表示表示 狭义:发病至死亡的时间跨度狭义:发病至死亡的时间跨度 广义:起始事件到终点事件的时间间隔广义:起始事件到终点事件的时间间隔 起始事件起始事件 终点事件终点事件 服药服药 痊愈痊愈 手术切除手术切除 死亡死亡 出院出院 复发复发三、三、完全数据与删失数据完全数据与删失数据 完全数据:可获得准确的生存时间,所提供信息完全完全数据:可获得准确的生存时间,所提供信息完全 删失数据删失数据(截尾值截尾值):随访中未能观察到病人的:随访
7、中未能观察到病人的 终点事件,右上角加终点事件,右上角加“+”原因:失访原因:失访 死于其它疾病死于其它疾病 观察结束时病人尚存活观察结束时病人尚存活ABCDEF0127235418910116四、数据结构四、数据结构 生存信息生存信息 起始时间起始时间 终点时间终点时间 结局及原因结局及原因 失访失访 存活存活 死亡死亡 预后信息预后信息 一般信息一般信息 个人史及既往史个人史及既往史 临床资料临床资料 检验结果检验结果 组织病理组织病理 分子生物学分子生物学 影像学影像学 与 亚饭店 五、资料特点五、资料特点 1 含截尾数据含截尾数据 2 分布类型复杂分布类型复杂六、资料的基本要求六、资料
8、的基本要求 1.终点事件例数不宜太少终点事件例数不宜太少 2.截尾原因无偏性截尾原因无偏性 3.生存时间尽可能记录精确生存时间尽可能记录精确七、统计描述指标七、统计描述指标 1.死亡率、死亡概率、生存概率死亡率、死亡概率、生存概率 2.生存率及其标准误生存率及其标准误 3.生存曲线生存曲线 4.中位生存时间及四分位数间距中位生存时间及四分位数间距1.死亡率、死亡概率、生存概率(1)死亡率死亡率 (mortality rate,death rate)表示某单位时间内的表示某单位时间内的死亡强度死亡强度。年平均人口数年平均人口数=(年初人口数年初人口数+年末人口数年末人口数)20001000年平均
9、人口数年内死亡人数年死亡率m(2)死亡概率死亡概率(mortality probability)指死于某时段内的可能性大小。指死于某时段内的可能性大小。d/n0 年内有删失,分母用校正人口数:年内有删失,分母用校正人口数:校正人口数校正人口数=年初人口数年初人口数删失删失例数例数/2 n0c/2年初观察例数年内死亡人数年死亡概率q(3)生存概率生存概率(survival probability)指某单位时段开始时存活的个体到该时段结束时仍存指某单位时段开始时存活的个体到该时段结束时仍存活的可能性的大小。活的可能性的大小。(n0-d)/n0 分子为年末尚存人数,分子为年末尚存人数,若年内有删失,
10、分母用校正人口数。若年内有删失,分母用校正人口数。qp死亡概率年生存概率 1年初人口数该年活满一年的人数60例肺癌病人,术后每年死亡例肺癌病人,术后每年死亡10例,无删失。例,无删失。N=60术后术后 年内年内 年内年内 年初年初 年年 死亡 死亡 生存 (t+1)年 年年 死亡死亡 截尾截尾 观察观察 平均平均 率 概率 概率 生存率 数数 例数例数 例数例数 例数例数 例数例数 p=1-q t d c n0 n=no-d/2 m=d/n q=d/n0 (n0-d)/n0 (n0-d)/N(1)(2)(3)(4)(5)(6)(7)(8)(9)0 10 0 60 55 .185 .167 .8
11、33 .833 1 10 0 50 45 .222 .200 .800 .667 2 10 0 40 35 .286 .250 .750 .500 3 10 0 30 25 .400 .333 .667 .333 4 10 0 20 15 .667 .500 .500 .167注意:注意:死亡率与死亡概率的分子相同,但分母不同;死亡率与死亡概率的分子相同,但分母不同;生存概率与生存率的分子相同,但分母不同生存概率与生存率的分子相同,但分母不同2.生存率生存率生存率(survival rate)(累积生存概率累积生存概率 cumulative probability of survival)指病
12、人经历指病人经历t个单位时间后仍存活的概率。个单位时间后仍存活的概率。生存概率指单个时段的概率,生存概率指单个时段的概率,生存率指从生存率指从0t多个时段的积累概率。多个时段的积累概率。反映了病人的疾病严重程度、进展快慢或凶险程度等。反映了病人的疾病严重程度、进展快慢或凶险程度等。公式公式1 用于完全数据用于完全数据公式公式2用于删失数据以及完全数据用于删失数据以及完全数据S(t)=P(T tk)=p1 p2 pk时刻内观察总例数时刻仍存活例数tttTPtS)()(3 生存曲线(survival curve)以观察(随访)时间为横轴,以生存率为纵轴,将各个以观察(随访)时间为横轴,以生存率为纵
13、轴,将各个时间点所对应的生存率连接在一起的曲线图。时间点所对应的生存率连接在一起的曲线图。描述生存过程描述生存过程 比较生存过程比较生存过程 中位生存期中位生存期 Survival Functions生存时间50403020100Cum Survival1.0.8.6.4.20.0组别乙疗法组乙疗法组-censored甲疗法组甲疗法组-censored(月)4 中位生存时间(median survival time)即生存时间中位数,表示即生存时间中位数,表示50%的个体可存活的时的个体可存活的时间间(集中趋势集中趋势)计算:图解法计算:图解法 线性内插法线性内插法:找出两个生存率找出两个生存
14、率S(ti-1)和和S(ti),使使 S(ti-1)0.5,S(ti)8)=0.565,t=10,P(X10)=0.478 (8-10):(8-t)=(0.565-0.478):(0.565-0.5),t=9.494(月月)生存率的计算方法生存率的计算方法 第三节小样本生存率的第三节小样本生存率的 Kaplan-MeierKaplan-Meier估计估计Kaplan-MeierKaplan-Meier法法(K-M(K-M法、乘积极限法法、乘积极限法)Kaplan-Meier法由法由Kaplan和和Meier于于1958年提年提 出,直接用概率乘法定理估计生存率,故称乘出,直接用概率乘法定理估计
15、生存率,故称乘 积极限法(积极限法(product-limit method),是一种),是一种 非参数法,适用于小样本和大样本。非参数法,适用于小样本和大样本。基本思想基本思想:将生存时间由小到大依次排列,在每个死亡点:将生存时间由小到大依次排列,在每个死亡点上,计算其期初人数、死亡人数、死亡概率、生存概率上,计算其期初人数、死亡人数、死亡概率、生存概率和生存率。和生存率。本法只估计本法只估计死亡时点死亡时点的生存率的生存率 (a)研究终止在475天 (b)研究终止在474天图12-3 乘积极限法生存曲线(阶梯形阶梯形)及其半数生存期(Md=158天)0100200300400500t(da
16、y)0.00.20.40.60.81.0S(t)S(132)=0.50100200300400500t(day)0.00.20.40.60.81.0S(t)Md=158 第四节第四节 大样本生存率的大样本生存率的 寿命表法估计寿命表法估计寿命表法寿命表法 (Life Tables)(Life Tables)基本原理基本原理:是先求出病人在治疗后活过是先求出病人在治疗后活过n年后再活过下一年年后再活过下一年的可能性,统计学上称为生存概率,根据概率论的乘法的可能性,统计学上称为生存概率,根据概率论的乘法定律将逐年生存概率相乘即可得出一定年限的生存率。定律将逐年生存概率相乘即可得出一定年限的生存率。
17、适用于大样本资料适用于大样本资料 K-MK-M法和法和Life tableLife table法比较法比较第五节第五节 生存曲线比较的生存曲线比较的 假设检验假设检验log-ranklog-rank检验(对数秩检验、时序检验)检验(对数秩检验、时序检验)基本原理基本原理:对每组生存数据根据其在各个时刻中尚存活的:对每组生存数据根据其在各个时刻中尚存活的对象数计算期望死亡数,然后将期望死亡总数与实际死对象数计算期望死亡数,然后将期望死亡总数与实际死亡数进行比较亡数进行比较 将生存曲线作为整体对曲线与曲线间的差异进行比较,将生存曲线作为整体对曲线与曲线间的差异进行比较,偏重于远期疗效评价,属非参数
展开阅读全文