SPSS在医学统计学中的应用全面版课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《SPSS在医学统计学中的应用全面版课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 医学 统计学 中的 应用 全面 课件
- 资源描述:
-
1、SPSS在医学统计学中的应用公共卫生学院流行病与卫生统计教研室刘艳梅 常用的统计软件SAS(Statistics Analysis System),最早由北卡罗来纳大学的两位生物统计学研究生编制,并于1976年成立了SAS软件研究所,正式推出了SAS软件。R语言 主要用于统计分析、绘图的语言和操作环境。R本来是由来自新西兰奥克兰大学的Ross Ihaka和Robert Gentleman 开发(也因此称为R),现在由“R开发核心团队”负责开发。SPSS(Statistical Product and Service Solutions)简介SPSS(Statistical Product an
2、d Service Solutions),“统计产品与服务解决方案”软件。最初软件全称为“社会科学统计软件包”(Solutions Statistical Package for the Social Sciences),但是随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司已于2000年正式将英文全称更改为“统计产品与服务解决方案”,标志着SPSS的战略方向正在做出重大调整。之后推出了一系列用于统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品及相关服务,有Windows和Mac OS X等版本。SPSS是世界上最早的统计分析软件,由 斯坦福大学的三位研究生Norman H
3、.Nie、C.Hadlai(Tex)Hull 和 Dale H.Bent于1968年研究开发成功,同时成立了SPSS公司,并于1975年成立法人组织、在芝加哥组建了SPSS总部。1984年SPSS总部首先推出了世界上第一个统计分析软件微机版本SPSS/PC+,开创了SPSS微机系列产品的开发方向,极大地扩充了它的应用范围,并使其能很快地应用于自然科学、技术科学、社会科学的各个领域。世界上许多有影响的报刊杂志纷纷就SPSS的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价。年7月28日,IBM公司宣布将用12亿美元现金收购统计分析软件提供商SPSS公司。如今SPSS已出至版
4、本22.0,而且更名为IBM SPSS。1.基本特点2.主要窗口及功能3.运行环境一、SPSS的概述 1.操作简便 SPSS软件基本操作通过点击鼠标就可以完成,有一定的统计学基础、熟悉Windows的基本操作就可以自学使用,除了数据录入需要使用键盘,常见的统计分析方法完全可以通过菜单、对话框的操作来完成,不需要编程。基本特点82.数据管理功能强大SPSS集成了数据录入、转换、检索、统计分析、作图、制表及编程功能,也可以从外部导入数据,如通过Excel表格、txt文本读入数据库。3.统计分析方法比较全面SPSS统计过程包括了常用的、较为成熟的统计分析方法,提供了从简单的描述统计到复杂的多因素统计
5、分析方法,例如数据的探索性分析、一般统计描述、简单列联表分析、均数比较、一般线性模型、混合模型、相关回归、对数线性模型、聚类和判别、因子和对应分析、非参数检验以及生存分析等等等等。SPSS主要由三大窗口:数据编辑窗口(data editor)结果输出窗口(view editor)程序编辑窗口(syntax editor)主要窗口及其功能数据编辑窗口:在“数据视图”中可以输入变量;“变量视图”中可以设定不同变量的属性。12变量值标签的添加方法语法编辑窗口:编辑语法、运行由语法组成的过程文件。二、数据文件的建立、导入与导出结果输出窗口:输出程序运算结果及各种操作的记录通过数据编辑窗口输入数据文件的
6、建立、调用和保存可以在文件菜单的指引下操作。.sav-数据文件-数据编辑.spo-输出结果文件-结果编辑.sps-命令程序文件-语法编辑SPSS主要的存储类型1.数据编辑2.数据搜索3.变量的插入与删除4.观察单位的插入与删除5.观测值排序6.数据文件的拆分与合并7.变量加权三、数据文件整理数据操作在数据编辑窗口中的“Data View”视窗下进行。可以对选定的操作对象进行剪切、拷贝、粘贴等操作。可以直接用鼠标右键进行操作,也可以用“编辑”下拉菜单中的选项进行操作,还可以用键盘上的快捷键来完成操作“control”+“X”(剪切)、“control”+“C”(拷贝)、“control”+“V”
7、(粘贴)1.搜索指定的记录编号:从“编辑”菜单中选择“转至个案”,只要在弹出的“个案数”中键入欲搜索的记录编号,光标就会自粽跳到该记录上。2.搜索指定变量中的指定数据的单元格:打开数据文件,光标移到变量所在的任意单元格,单击,然后从“编辑”菜单中选择“查找”,在弹出的对话框中键入需要查找的数据,然后点击“查找下一个”,光标会自动跳入该值所在的单元格。3.变量的插入与删除4.观察单位的插入与删除5.观测值排序以上三项操作均可以通过在选定变量或个案后,点击鼠标右键来完成操作在进行数据的处理时,经常要对文件中的观察单位进行分组分析,例如,按男性、女性计算“年龄”的平均值,因此在进行分析计算是要对数据
8、文件进行拆分。注意:此处的“拆分”并不是物理结构上,将数据库拆分为两个数据文件,仅为运算形式上的拆分。2.增加变量:从外物数据文件增加变量到当前数据文件,成为横向合并或追加变量,合并后的数据文件包含相同的观察量。数据文件的合并包括两种方式:1.增加观察单位:从外部数据文件中增加观察单位到当前数据文件中,称为纵向合并或追加观察单位,这种合并方式要求两个数据文件中的变量相同。统计分析中经常要用到变量加权,如计算加权平均数,在选择加权变量时,应该注意:加权变量中含有零、负整数、或者缺失值的记录将会被排除在外;分数值有效;一旦对数据进行了加权处理,那么在以后的分析中加权处理一直有效,直到关闭加权处理过
9、程或者选择其他的加权变量进行加权处理。操作步骤:“数据”“加权个案”“频率变量”1.新变量的建立2.变量的重新赋值3.观察单位的排秩4.缺失值的替代四、数据转换在医学科研实践中,仅使用原始数据新型分析处理往往是不够的,应根据统计分析的需要,对原始数据进行转换,生成新的变量或进行重新编码等。SPSS的数据转换功能主要通过“转换”菜单来实现。SPSS提供了14类180多种函数,用户可以根据需要,利用这些函数建立一些新的变量,常用函数如下:1.算数函数2.统计函数3.缺失值函数4.字符型函数5.日期、时间函数6.逻辑函数操作步骤:“转换”“计算变量”以年龄分组为例:将数据文件中的年龄分成几个年龄组,
10、以5岁为一组,将分组后的各组相应的赋值为1,2,3,4,5菜单选择:“转换”“重新编码为不同变量”某些统计分析过程需要对变量的秩进行分析,例如秩和检验,需要先对变量进行排秩。SPSS提供了该功能菜单选择:“转换”“个案等级排序”SPSS的某些统计过程会因为数据文件带有缺失值而无法执行,例如在进行时间系统的统计分析时,要求相邻观测量中的变量值是在相等的时间间隔内测得,不能将带有缺失值的观测量排除掉,SPSS提供了多种方法估计并替换缺失值。菜单选择:“转换”“替换缺失值”。1.频数分布分析2.描述性统计分析3.探索性分析五、统计描述统计分析包括两个方面:统计描述;统计推断。统计描述指选用恰当的统计
11、指标,通常称为统计量,选用合适的统计表与统计图,对资料的数量特征及其分布规律进行测定和描述。SPSS中用于统计描述的统计量主要由以下几类:1.描述集中趋势的指标:算数均数、几何均数、中位数2.描述离散趋势的指标:极差、四分位数间距、方差、标准差3.百分位数指标4.描述数据分布的统计量:偏度系数、峰度系数SPSS中的“描述统计”菜单可以完成上述各种统计量并可以绘制统计图表,主要包含以下几大模块:“频率”过程:主要用于产生频数表;“描述”过程:对变量进行描述性统计分析,计算统计指标;“探索”过程:对变量进行更为深入的描述性统计分析。频数分布分析可以产生详细的频数表,并可以按要求给出条图、直方图以及
12、集中趋势和离散趋势的各种统计量,描述数据的分布特征。以书后练习为例1.建立数据文件2.统计分析:“分析”“描述统计”“频率”“statistic”/“图表”“确定”3.主要输出结果描述性统计分析主要用以描述集中趋势和离散趋势的各种统计量,还有一个特殊功能,就是可以对变量进行标准化处理。以书后练习为例1.打开数据文件2.统计分析:“分析”“描述统计”“描述”“选项”“确定”3.主要输出结果标准差与标准误的区别:标准差能反映一个数据集的离散程度。标准误用来衡量抽样误差。标准误越小,表明样本统计量与总体参数的值越接近,样本对总体越有代表性,用样本统计量推断总体参数的可靠度越大。探索性分析的目的是对数
13、据进行初步检查,判断有无奇异值和极端值;判断变量是否服从正态分布;对数据进行初步考察。以书后练习为例1.打开数据文件2.统计分析:“分析”“描述统计”“探索”“statistic”3.主要输出结果1.单样本均数比较2.配对设计均数比较3.完全随机设计两均数比较六、两个均数比较的t检验SPSS在“分析”菜单中的“比较均值”选项提供的t检验方法过程有单样本t检验、配对样本t检验、独立样本t检验。单样本均数比较的t检验即已知样本均数与已知总体均数的比较。本法是检验单个样本均数所代表的未知总体均数与已知总体均数是否有差别的参数检验方法过程。1.单样本均数比较例:某医生测得36名男性矿工的血红蛋白含量为
14、:112,137,129,126,88,90,105,178,130,128,126,103,172,116,125,90,96,62,157,151,135,113,175,129,165,171,128,128,160,110,140,163,100,129,116,127(g/L),问,这36名矿工的血红蛋白含量与正常男性(平均值为140g/L)有无不同?建立数据库文件时,产生一个变量“Hb”,类型为数值型,共36行1列。()统计分析:“分析”“比较均值”“单独样本T检验”不要忘记统计量,自由度df=35,双侧检验,差值的均数为,95%可信区间为,-2.6),按水准,可认为矿工的血红蛋白
展开阅读全文