SAS的生存分析(正式)课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《SAS的生存分析(正式)课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SAS 生存 分析 正式 课件
- 资源描述:
-
1、l了解生存分析的应用范围和数据特点;l熟悉常见的生存时间分布规律的函数;l掌握生存率的两种估计方法:乘积极限法和寿命表法;l掌握估计和比较生存函数的SAS程序;lCox回归的形式、数据格式、应用和SAS程序。l在医学研究中,常常用随访的方式来研究事物发展的规律。例如,了解某药物的疗效,了解某仪器设备的使用寿命,了解手术后的存活时间等等。这种研究的特点是追踪研究的现象都要经过一段时间,统计学上将这段时间称为生存时间。生存分析就是用来研究生存时间的分布规律以及生存时间和相关因素之间关系的一种统计分析方法。 l生存分析在医学科学研究中具有广泛而重要的应用价值,它对人群寿命的研究,各种慢性疾病的现场追
2、踪研究,临床疗效试验和动物试验等研究中随访资料的处理起着举足轻重的作用。l生存数据,指的是生存时间以及与生存时间有关联的一组独立变量。这里主要解释与生存时间有关的几个概念。l在生存分析中将生存时间定义为从某起始事件起到某终止事件为止所经历的时间跨度。例如,在临床研究中,冠心病患者在两次发作之间的时间间隔;在流行病学研究中,从开始接触危险因素到发病所经历的时间;在动物研究中,从开始给药到发生死亡所经历的时间。所以,生存时间也称为失效时间。l生存时间资料与多元线性回归资料很相似,只不过因变量通常为观测对象生存的时间,常用来表示。当然,生存时间是广义的,可以指在通常意义下生物体的生存时间、也可以指所
3、关心的某现象(如疾病治愈后、合格品使用后)持续的时间。若生存时间是准确观测到的,则称为完全数据,它提供的关于生存时间的信息是完整确切的,也就是说它准确地度量了观察对象实际生存时间。但是生存资料的一个明显特点是:所收集的资料中常常包含不完全数据,也称为截尾数据、删失数据。包括删失数据的资料,称为删失资料(或截尾数据)。它提供的关于生存时间的信息是不完整不确切的,也就是说它没有准确地度量观察对象实际生存的时间。l导致数据删失有很多原因,较常见的为失访和研究截止。由随机因素引起的,称为随机删失;若事先就定了截止日期,则称为定时删失;若事先就定了观察完多少例就截止研究,则称为定数删失。 在表达删失数据
4、时, 常在其右上角放一个“”号;而用SAS软件分析时,常在其前放一个“”号或产生个指示变量(例如,=表示删失数据、=表示完全数据),便于计算时区别对待。为了使数据的表达与计算在形式上统一起来,本章一律用负数表示删失数据,因生存时间不可能为负值,故不会产生混淆。l一般地,截尾数据可分为右截尾、左截尾、区间截尾等不同类型。右截尾数据表示观察对象至少存活到时刻t,即生存时间的上界是未知的。右截尾数据一般出现在随访过程中某些观察对象失访或死于其它原因,或在规定的研究过程结束时观察对象的终止事件还未发生。左截尾数据表示观察对象至多存活到时刻t,即生存时间的上界是已知的,但确切的生存时间是未知的。区间截尾
5、数据表示观察对象至少存活到t1时刻且至多存活到t2时刻。l对于截尾数据,既不能简单地弃之,需要采取一些技术处理。专门处理这种资料的统计方法,称为生存分析。应为抛弃截尾数据不仅损失了样本量,最重要的是在这些截尾数据中,特别是右截尾数据大部分是生存时间较长者的数据,损失掉这一部分观察对象的信息,分析结果一定是片面或不稳定的。l截尾数据的存在是生存数据与普通数据的根本区别。处理截尾数据是生存分析的一个重要特点,本章介绍的生存分析主要处理右截尾数据。l描述生存时间分布规律的函数统称为生存时间函数。常用的有生存函数、死亡函数、死亡密度函数和风险函数。l生存函数也称为生存概率或累积生存率,它表示观察对象生
6、存时间T大于某时刻t的概率常用S(t)表示:l在具体问题中,该函数在时刻的取值可用下式来估计lS(t)生存时间长于的观察对象人数观察对象总数l显然,S(t)是一个随时间增加而下降的函数,它表示观察对象随访到t时刻的累积生存率。)(Pr)(tTobtSl观察对象的生存时间T不大于某时刻t的概率称为死亡函数,又称为死亡概率函数简称为死亡概率,它表示一个体从开始观察起到时刻为止的死亡概率,常用F(t)表示:l显然,F(t)是一个随时间增加而上升的函数,它表示观察对象随访到t时刻的累积死亡率。)(Pr)(tTobtFl死亡密度函数简称为密度函数,观察对象在某时刻t的瞬时死亡率,常用f(t)表示:l该函
7、数表示观察对象死于(t,t+t)小区间内的概率的极限。在具体问题中,该函数在时刻的取值可用下式来估计lf(t)t时刻开始的区间内(t,t+t)的死亡人数(观察总人数区间宽度)l )()(Prlim)(tFtttTtobtf时间数时间区间所包含的单位,观察总人数内的死亡人数,观察对象在时间区间tt)(tttttfl它表示已存活到时刻t的观察对象在时刻t的瞬时死亡率,又称危险函数,常用h(t)表示:l该函数表示一个已存活到时刻t的观察对象死于(t,t+t)小区间内的概率的极限,它实际上是一个条件瞬时死亡率。 在具体问题中,该函数在时刻的取值可用下式来估计:l )()()(Prlim)(tStftt
8、TttTtobth时间数时间区间所包含的单位,时间生存者人数内的死亡人数,观察对象在时间区间tt)()()(ttttttStfthl除了上述的生存时间函数外,均数、中位数、半数生存期等也反映一组生存时间平均水平常用的统计指标。由于生存资料多呈正偏态分布,更适宜选用百分位数,包括中位数指标。l半数生存期,指寿命的中位数,表示有且只有50%的观察对象可以活这么长时间。由于截尾数据的存在,半数生存期的计算不同于普通的中位数,它可应用生存函数曲线图或生存函数公式,令生存率等于50%,然后推算生存时间。l总之,生存分析主要包括四个方面的内容:描述生存过程,即研究生存时间的分布规律;比较生存过程,即研究两
9、组或多组生存时间的分布规律,并进行比较;分析危险因素,即研究危险因素对生存过程的影响;建立数学模型,即将生存时间与相关危险因素的依存关系用一个数学式子表示出来。l统计描述 l非参数检验 l半参数模型回归分析 l参数模型回归分析 l包括求生存时间的分位数、中数生存期、平均数、生存函数的估计、判断生存时间的图示法,不对所分析的数据作出任何统计推断结论。l用描述法进行生存分析的基本方法是根据样本观察值提供的信息,直接用上述给出的估计公式计算出在每一时间点或每一个时间区间上的生存函数、死亡函数、风险函数以及计算出生存时间的百分位数、平均数、半数生存期等,并采用列表或绘图的形式显示生存时间的分布规律。
10、l用描述法估计生存时间分布规律的优点是方法简单且对数据的分布无要求,但它的缺点是不能比较两组或多组生存时间分布函数的区别;不能分析危险因素对生存时间的影响;不能建立生存时间与危险因素之间的数量依存关系模型。 l检验分组变量各水平所对应的生存曲线是否一致,对生存时间的分布没有要求,并且检验危险因素对生存时间的影响。l非常数法可以用来完成:估计生存函数;比较两组或多组生存函数;分析危险因素对生存时间的影响。缺点是不能建立生存时间与危险因素之间的数量依存关系的数学模型。常用的方法有乘积极限法(PL法)和寿命表法(LT法)。l在特定的假设之下,建立生存时间随多个危险因素变化的回归方程。l半常数法不需要
11、对生存时间的分布作出假定,但却可以通过一个模型来分析生存时间的分布规律,以及危险因素对生存时间的影响。这种方法的代表是Cox比例风险回归分析法,它兼有非常数法和参数法的优点,是生存分析中最重要的模型分析法。它在表达形式上与参数模型相似,但在对模型中各参数进行估计时又不依赖于特定分布的假设,所以又称其为半参数模型。l已知生存时间服从特定的参数模型时,拟合相应的参数模型,更准确地分析确定变量之间的变化规律。l用参数法进行生存分析的基本方法是根据样本观察值来估计假定的分布模型中的参数,获得生存时间的概率分布模型。用参数法进行生存分析需要事先知道生存时间的分布,但它的优点是:比较两组或多组生存时间分布
12、函数;分析危险因素对生存时间的影响;建立生存时间与危险因素之间依存关系的模型。l生存时间经常服从的分布有指数分布、Weibull分布、对数正态分布、对数Logistic回归和Gamma分布。lSAS系统中,LIFETEST过程提供非参数分析方法,用乘积极限法和寿命表法估计生存率和中位生存时间等;用对数秩检验(Log-rank test)、Wilcoxon检验和似然比检验等做分组比较。该过程主要用于估计生存率及进行单因素分析。 lLIFETEST过程的语法格式如下: PROC LIFETEST ; TIME 生存时间变量*截尾指示变量(数字); TEST ; STRATA ; FREQ ; BY
13、 ; Run;lDATA数据集:规定PROC FREQ语句使用的数据集;lMETHOD=方法:指定估计生存率所用的方法;PL,要求用乘积极限法(即Kaplam-Meier法)估计生存率并计算中位生存时间等,为缺省方法。LT,要求用寿命表法估计生存率等。INTERVALS=(初值 TO 终值 BY 步长) 只能在指定分析方法为寿命表法时使用。用寿命表法分析时,程序会自动给定生存时间的区间。如果人为规定生存时间的分组区间,则需用该选项指定。步长的缺省值为1。lWIDTH=宽度:指定用LT法的生存时间区间的宽度。lPLOTS=绘图类型:要求输出生存分析图。可供输出的图形有:S,对生存函数S(t)做图
展开阅读全文