SPSS在医学统计中的应用课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《SPSS在医学统计中的应用课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 医学 统计 中的 应用 课件
- 资源描述:
-
1、内容安排内容安排 第一讲第一讲 医学统计分析概述医学统计分析概述 第二讲第二讲 定量资料组间比较的统计分析定量资料组间比较的统计分析 第三讲第三讲 分类资料组间比较的统计分析分类资料组间比较的统计分析 第四讲第四讲 相关性分析与线性回归分析相关性分析与线性回归分析 第五讲第五讲 logistic回归分析回归分析 第六讲第六讲 诊断试验的评价与诊断试验的评价与ROC分析分析 第七讲第七讲 生存分析生存分析第一讲第一讲 医学统计分析概述医学统计分析概述 一、医学统计学的主要内容一、医学统计学的主要内容 包括研究设计、资料收集、数据整理、数据 分析等一系列过程。二、医学统计学的主要功能二、医学统计学
2、的主要功能 帮助我们透过现象认识本质,从一堆看似杂乱 无章的数据中发现规律,阐明事物的本质。三、数据统计分析的一般思路三、数据统计分析的一般思路 1.确定研究目的,根据研究目的选择方法。确定研究目的,根据研究目的选择方法。不同研究目的采用的统计方法不同,在医学统计中,常见的研究目的主要有三类:一是差异性研究,即比较组间均数、率等的差异,可用的方法有t检验、方差分析、卡方检验、秩和检验等;二是相关性分析,即分析两个或多个变量之间的关系,可用的方法有相关分析;三是影响性分析,即分析某一结局发生的影响因素,可用的方法有线性回归、logistic回归、cox回归等。2.明确数据类型,根据数据类型进一步
3、确定方法明确数据类型,根据数据类型进一步确定方法 定量数据可用的方法:t检验、方差分析、非参数检验、相关分析、线性回归等;分类资料(定性数据)可用的方法:卡方检验、秩和检验、对数线性模型、logistic回归等。3.选定统计方法后,利用统计软件具体实现统计分选定统计方法后,利用统计软件具体实现统计分析过程。析过程。4.针对分析结果,结合实际做出合理的专业结论。针对分析结果,结合实际做出合理的专业结论。四、统计学应用的几个误区四、统计学应用的几个误区 1.研究目的大而全研究目的大而全 2.方法一味追求新颖方法一味追求新颖 3.统计学方法盲目套用统计学方法盲目套用数据的类型数据的类型统计分析的基础
4、是数据,而数据的类型可以分为:1.定量数据定量数据 又分为连续型数据和离散型数据。连续性数据可以取任意值,比如,身高,体重,化验值等等;离散型数据只能取整数,如发病人数等。2.定性数据(分类资料)定性数据(分类资料)又可分为无序分类资料和有序分类资料两类。无序分类资料无序分类资料是指所分类别或属性之间无程度和顺序的差别,例如二项分类,性别(男、女),药物反应(阴性、阳性)等。例如多项分类,血型(O、A、B、AB等。有序分类资料有序分类资料是指各类别之间有程度的差别。如尿糖化验结果按、+、+、+分类;疗效按治愈、显效、好转、无效分类。数据的类型数据的类型数据资料定量数据定性数据(分类资料)连续型
5、变量(如:身高、体重等)离散型变量(如:发病人数等)无序分类资料(如:性别、血型等)有序分类资料(如:疗效等)差异性研究方法差异性研究方法组间差异性比较研究方法组间差异性比较研究方法 1.t 检验检验 主要用于两组定量资料的比较。要求数据满足三个前提条件:独立性、正态性、方差齐性。独立性即各研究对象的观测值是相互独立的,互不影响;正态性即要求两组数据均服从正态分布;方差齐性即两组样本数据所代表的总体方差相等。2.方差分析方差分析 主要用于多组连续变量的比较。要求数据满足独立性、正态性、方差齐性的条件。3.秩和检验秩和检验 (1)可用于不服从正态分布的定量资料的组间比较;(2)可用于有序分类资料
6、的组间比较;(3)对于不符合正态分布的数据,两组定量数据比较一般用Wilcoxon秩和检验,多组定量数据一般用kruskal-wallis秩和检验,随机区组定量数据一般用friedman秩和检验。4、2 检验检验 用于无序分类资料的组间比较。可用于两组或多组率的比较、两组或多组构成比的比较、两个分类变量之间的关联性分析,还可用于特定分布的拟合优度检验等。相关性分析研究方法相关性分析研究方法 影响性分析研究方法影响性分析研究方法 SPSS简介简介uSPSS(Statistics Product and Service Solutions),是目前世界上,是目前世界上最优秀的统计分析软件之一。最优
7、秀的统计分析软件之一。uSPSS是众多统计软件当中比较简是众多统计软件当中比较简单易懂的软件之一;绝大多数操作单易懂的软件之一;绝大多数操作过程仅靠点击鼠标即可完成。过程仅靠点击鼠标即可完成。uSPSS功能齐全,一般的数据分析功能齐全,一般的数据分析和图形处理都可以应付自如。和图形处理都可以应付自如。l nYabX第二讲第二讲 定量资料组间比较的统计定量资料组间比较的统计分析分析定量数据组间差异比较常用统计方法定量数据组间差异比较常用统计方法 1.t 检验检验 主要用于两组定量数据的比较。要求数据满足三个前提条件:独立性、正态性、方差齐性。独立性即各研究对象的观测值是相互独立的,互不影响;正态
8、性即要求两组数据均服从正态分布;方差齐性即两组样本数据所代表的总体方差相等。2.方差分析方差分析 主要用于多组连续变量的比较。要求数据满足独立性、正态性、方差齐性的条件。3.秩和检验秩和检验 (1)主要用于不服从正态分布的定量资料的组间比较;(2)对于不符合正态分布的数据,两组定量数据比较一般用Wilcoxon秩和检验,多组定量数据一般用kruskal-wallis秩和检验,随机区组定量数据一般用friedman秩和检验。分析思路分析思路1.确定分析方法确定分析方法 该研究目的是比较两组人群的血磷值,属于差异性检验。分析变量是血磷值,为连续性变量。结合研究目的,可以考虑的分析方法有独立样本的t
9、检验或wilcoxon秩和检验,具体还应进一步看数据是否服从正态分布。2.2.建立数据文件建立数据文件EG0201EG0201。共 2个变量:(1)group(分组):1=急性克山病患者,2=健康者;(2)p(血磷数值)。3.数据的正态性检验数据的正态性检验 “分析”“描述统计”“探索”打开“探索”对话框 因变量列表:血磷数值(glu)因子列表:分组group 绘制:带检验的正态图 从Shapiro-Wilk检验结果可以看到,group1的正态性检验P=0.835,group2的正态性检验P=0.316,都可以认为近似服从正态分布。4.独立样本独立样本t检验检验 “分析”“比较均值”“独立样本
10、T检验”,打开“独立样本T检验”对话框 检验变量:p 分组变量:group 定义组:1 25.5.结果及解释结果及解释 本例数据满足方差齐性(P=0.791),t检验统计量=2.576,P=0.017,故两组人群的差异是有统计学意义的。二、两组非正态分布资料的比较二、两组非正态分布资料的比较 例2.2 某医生为研究幽门螺杆菌与血清胃泌素-17之间的关系,在某地随机抽取幽门螺杆菌阳性和阴性对象各30例,测量两组人群的血清胃泌素-17水平。数据如表EX0202.欲比较两组人群的血清胃泌素-17水平是否有统计学差异。分析思路分析思路1.确定分析方法确定分析方法 该研究目的是比较两组人群的血清胃泌素-
11、17是否有差异,属于差异性检验。分析变量为连续性变量。结合研究目的,可以考虑的分析方法有独立样本的t检验或wilcoxon秩和检验,具体还应进一步看数据是否服从正态分布。2.2.建立数据文件建立数据文件EX0202EX0202。共 2个变量:(1)group(分组):1=阴性,2=阳性;(2)g(血清胃泌素-17水平)。3.数据的正态性检验数据的正态性检验 “分析”“描述统计”“探索”打开“探索”对话框 因变量列表:血清胃泌素-17水平(g)因子列表:分组group 绘制:带检验的正态图 从Shapiro-Wilk检验结果可以看到,阴性组不符合正态分布(P0.05,治疗前后的血红蛋白含量的差异
12、无统计学意义。例例2.7 某医生为观察某颈椎疼痛治疗仪治疗颈椎疼痛某医生为观察某颈椎疼痛治疗仪治疗颈椎疼痛的效果,随机抽取了的效果,随机抽取了30名颈椎疼痛患者,记录他们的名颈椎疼痛患者,记录他们的VAS评分,然后采用该治疗仪治疗评分,然后采用该治疗仪治疗10个疗程,再记录个疗程,再记录下他们的下他们的VAS评分,数据存于评分,数据存于EX0207(部分数据见(部分数据见表表2.6)。欲比较治疗后的)。欲比较治疗后的VAS评分是否比治疗前有评分是否比治疗前有所降低。所降低。患者序号患者序号 1 2 3 4 5 6 30 治疗前治疗前 5 8 7 5 5 4 4 治疗后治疗后 4 6 7 2 2
13、 3 3 分析思路分析思路 1、明确研究目的 该研究目的是通过比较30名颈椎疼痛患者治疗前后的VAS评分,以推断治疗前后的VAS评分是否有差异,属于差异性检验。该研究是比较同一人群的两次测量结果,属于配对设计。配对设计的分析一般以两组差值作为分析指标。分析方法可根据数据的分布考虑使用配对t检验或配对秩和检验。2.2.建立数据文件建立数据文件EX0207EX0207。两个变量:(1 1)VAS0:VAS0:治疗期的评分;(2 2)VAS1:VAS1:治疗后的评分。3.数据的正态分布检验数据的正态分布检验 “分析”“描述统计”“探索”打开“探索”对话框 因变量列表:VAS0 VAS1 绘制:带检验
14、的正态图 结果显示两个变量都不服从正态分布,所以选用配对秩和检验。4、配对符号秩检验、配对符号秩检验 “分析”“非参数检验”“2个相关样本”,打开“两个关联样本检验”对话框 检验对:VAS0VAS1 检验类型:Wilcoxon 5.5.结果及解释结果及解释 使用的方法是Wilcoxon符号秩检验,检验的 P0.0001,即治疗前后的VAS评分的差异有显著性意 义。本例中,治疗后VAS评分低于治疗前评分。七、七、随机区组设计的方差分析随机区组设计的方差分析lnYabX 七、随机区组资料的分析七、随机区组资料的分析 例例2.8 某研究生研究异常应力下椎间盘内蛋白多糖的变化,实验某研究生研究异常应力
15、下椎间盘内蛋白多糖的变化,实验设计采用了随机区组设计,按体重、窝别等因素,每设计采用了随机区组设计,按体重、窝别等因素,每3只健康纯只健康纯种成年新西兰大白兔配成一个区组,共种成年新西兰大白兔配成一个区组,共8个区组。每个区组内的个区组。每个区组内的3只大白兔随机分入对照组、颈椎制动组和颈椎加压组,然后测只大白兔随机分入对照组、颈椎制动组和颈椎加压组,然后测定各组椎间盘内蛋白多糖的光密度值并进行比较。数据存于定各组椎间盘内蛋白多糖的光密度值并进行比较。数据存于EX0208.表表2.8 三组的光密度值三组的光密度值 对照组对照组 0.37 0.41 0.39 .0.32 颈椎制动组颈椎制动组 0
16、.39 0.27 0.26 .0.28 颈椎加压组颈椎加压组 0.31 0.25 0.21 .0.20 分析思路分析思路1、确定分析方法、确定分析方法 该研究目的是比较光密度值在三组间是否有差异,属于差异该研究目的是比较光密度值在三组间是否有差异,属于差异性检验。该研究采用了随机区组设计,研究前已经将研究对性检验。该研究采用了随机区组设计,研究前已经将研究对象的各种可能影响因素进行了平衡。分析指标是光密度值,象的各种可能影响因素进行了平衡。分析指标是光密度值,为连续性变量。分析方法可以根据资料的正态性,考虑随机为连续性变量。分析方法可以根据资料的正态性,考虑随机区组的方法分析或随机区组的秩和检
17、验即区组的方法分析或随机区组的秩和检验即Friedman检验。检验。2、建立数据文件、建立数据文件EX0208.共共3个变量:个变量:(1)group(表示分组因素):(表示分组因素):1=对照组,对照组,2=颈椎制动组,颈椎制动组,3=颈椎加压组;颈椎加压组;(2)block(8个不同区组);个不同区组);(3)den(光密度值)。(光密度值)。3、正态性检验、正态性检验 三组数据均服从正态分布,故采用随机区组的方差分析方法。三组数据均服从正态分布,故采用随机区组的方差分析方法。4、方差分析、方差分析 “分析分析”“”“一般线性模型一般线性模型”“”“单变量单变量”,打开“单变量”对话框 因
18、变量列表因变量列表:weight 固定因子:group、block 模型 设定(custom)模型:group/block 在模型中包含截距 两两比较(Post Hoc)两两比较检验:group LSD S-N-K 选项 描述性 方差同质性检验(方差齐性检验)5、结果分析、结果分析结果显示,组间差异有统计学意义(结果显示,组间差异有统计学意义(F=10.064,P=0.002),区组间),区组间差异无统计学意义(差异无统计学意义(F=0.876,P=0.548)。)。根据两两比较结果,对照组和制动组之间差别有统计学意义(P=0.021),对照组和加压组之间差别有统计学意义(P=0.001),制
19、动组和加压组之间差别在0.1水平上有统计学意义(P=0.085)。定量数据组间比较的分析方法小结定量数据组间比较的分析方法小结1、两组独立样本比较、两组独立样本比较 两组独立数据的比较首先应看资料是否符合正态分布,是否符合方差齐性。(1)两组资料符合正态分布,且方差齐,采用t检验;(2)两组资料符合正态分布,但方差不齐,可采用 Satterthwate t检验;(3)资料不符合正态分布,可采用非参数检验,如 Wilcoxon秩和检验。2、两组配对资料比较、两组配对资料比较 两组配对资料比较主要看两组差值是否符合正态分布。(1)两组差值服从正态分布,采用配对t检验;(2)两组差值不服从正态分布,
20、采用Wilcoxon配对秩检验。3、多组独立样本比较、多组独立样本比较(1)资料符合正态分布,且各组方差齐,直接采用完全随机的方差分析。如果检验结果为组间差异有统计学意义,可进一步作两两比较。两两比较的方法有S-N-K法、Bonferroni法等;(2)资料不符合正态分布,可采用非参数检验的Kruskal-Wallis法。如果检验结果为组间差异有统计学意义,可进一步作两两比较。两两比较可以采用公式法计算,也可采用基于秩的方差分析法。4、多组随机区组样本比较、多组随机区组样本比较(1)资料符合正态分布,且各组方差齐,直接采用随机区 组的方差分析。(2)资料不符合正态分布,可采用非参数检验的Fri
21、edman 法。第三讲第三讲 分类资料组间比较的统计分类资料组间比较的统计分析分析分类资料组间差异比较常用统计方法分类资料组间差异比较常用统计方法 1、2 检验检验 用于无序分类资料的组间比较。可用于两组或多组率的比较、两组或多组构成比的比较、两个分类变量之间的关联性分析,还可用于特定分布的拟合优度检验等。2、秩和检验、秩和检验 用于有序分类资料的组间比较。一、四格表资料的分析一、四格表资料的分析例3.1 某研究所为探索幽门螺杆菌感染与胃黏膜病变进展之间的关系,在某地随机抽取了2200名非胃癌居民,对幽门螺杆菌感染状况进行血清学检测,根据检测结果分为幽门螺杆菌阳性组和阴性组。随访5年后,共有1
22、889例研究对象完成了全部的胃镜检查和胃黏膜病理学诊断。其中幽门螺杆菌阳性组中病变进展者35人,未进展者443人;阴性组中病变进展者164人,未进展者1247人。整理成表3.1的四格表形式,欲分析幽门螺杆菌阳性组与阴性组的病变进展率是否有差异。表表3.1 病变无进展病变无进展 病变进展病变进展 合计合计 阴性阴性 1247 164 1411 阳性阳性 443 35 478 合计合计 1690 199 1889 分析思路分析思路1、确定分析方法、确定分析方法 该研究目的是比较两组的病变进展率是否有统计学差异,属于差异性检验。数据为分类资料,分组变量是幽门螺杆菌的感染状况,分析变量是病变进展情况,
23、均为二分类变量。结合研究目的,首选的方法是四格表资料的卡方检验。当然还可以考虑用Logistic回归,但卡方检验更为简便通用,因此采用卡方检验进行分析。2.建立数据文件建立数据文件 EX0301。有3个变量:(1)hp(感染状况):1=阴性,2=阳性;(2)progression(病变进展):1=无进展,2=进展;(3)f(频数)。2.统计分析:统计分析:(1)“数据”“加权个案”,打开“加权个案”对话框 加权个案:f (2)“分析”“描述统计”“交叉表”,打开“交叉表”对话框 行:hp 列:progression 统计量 卡方(Chi-square)风险 单元格 观察值 期望值 行3.结果及
24、解释结果及解释 本次研究结果表明,幽门螺杆菌阴性组和阳性组的病变进展率差异有统计学意义(2=7.007,P=0.008),幽门螺杆菌阳性人群发生病变进展的危险是阴性人群的1.587倍(95%CI:1.1192.552),提示幽门螺杆菌感染是胃黏膜病变进展的危险因素。二、二、R2表资料的分析表资料的分析例3.2 某医院在某胃癌高发地区随机抽取了2646名当地居民,根据胃黏膜病理检查结果,将人群分为浅表性胃炎(SG)或轻度慢性萎缩性胃炎(CAG)、重度CAG、肠上皮化生(IM)和异型增生(DYS)四组,每组人群检测其幽门螺杆菌感染状况,结果列于表3.2.欲比较四组人群的幽门螺杆菌阳性率是否有差异。
25、表表3.2 不同胃黏膜病变的幽门螺杆菌阳性率不同胃黏膜病变的幽门螺杆菌阳性率 阴性阴性 阳性阳性 合计合计 SG或轻度或轻度CAG 413 609 1022 重度重度CAG 29 190 219 IM 182 677 859 DYS 120 426 546 合计合计 744 1902 2646 分析思路分析思路1、确定分析方法、确定分析方法 该研究目的是比较四组的阳性率是否存在统计学差异,属于差异性检验。分组变量是胃病理状况,为多分类变量,分析指标是幽门螺杆菌感染状况,为二分类变量,属于R2列联表。本例分组指标为病变严重程度,尽管属于有序分类变量,但无序和无序变量不同方法的选择是根据分析指标而
展开阅读全文