spss入门基本操作课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《spss入门基本操作课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- spss 入门 基本 操作 课件
- 资源描述:
-
1、Statistical Program for Social Sciences2008年11月30日1 简介简介SPSS是Statistical Program for Social Sciences 的简称,即社会科学统计程序,由美国SPSS公司1970年代推出,迄今已有近30年的历史。是国际著名三大社会科学统计软件包之一(SAS、SPSS、Statis)。我们现在使用的是SPSS for Windows 13.0版。2008年11月30日第一章第一章 SPSS初步数据分析实例详初步数据分析实例详解解1.1 数据的输入和保存1.1.1 SPSS的界面1.1.2 定义变量1.1.3 输入数据1
2、.1.4 保存数据1.2 数据的预分析1.2.1 数据的简单描述1.2.2 绘制直方图1.3 按题目要求进行统计分析1.4 保存和导出分析结果1.4.1 保存文件1.4.2 导出分析结果以SPSS 10.0版版1.5 打开其他文件格式1.5.1 直接打开1.5.2 使用数据库查询打开1.5.3 使用文本导入向导读入文本文件1.6编辑数据文件1.6.1定义新变量1.6.2 数据录入技巧1.7进一步整理数据文件-Data菜单1.7.1 用于数据管理的菜单项1.7.2 正交设计菜单项2008年11月30日例1.1 某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下, 问该地急性
3、克山病患者与健康人的血磷值是否不同?患者: 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11健康人: 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.872008年11月30日让我们把要做的事情理理顺:首先要做的肯定是打开计算机(废话),然后进入Windows,在进入SPSS后,具体工作流程如下:将数据输入SPSS,并存盘以防断电。进行必要的预分析(分布图、均数标准差的描述等),以确定应采用的检验方法。按题目要求进行统计分析。保存和导出分析结果。下面就按这几步
4、依次讲解。2008年11月30日1.1 数据的输入和保存1.1.1 SPSS的界面2008年11月30日1.1.2 定义变量该资料是定量资料,设计为成组设计,因此我们需要建立两个变量,一个变量代表血磷值,习惯上取名为X,另一个变量代表观察对象是健康人还是克山病人,习惯上取名为GROUP。选择菜单Data=Insert Variable。点击Variable View,将变量名改为GROUP和X。现在,第一、第二列的名称均为深色显示,表明这两列已经被定义为变量,其余各列的名称仍为灰色的“var”,表示尚未使用。同样地,各行的标号也为灰色,表明现在还未输入过数据,即该数据集内没有记录。2008年1
5、1月30日1.1.3 输入数据在Data View中输入相应的数据,一个单元格输入一个数据,Group中输入1代表患者,2代表健康人。2008年11月30日1.1.4 保存数据选择菜单File=Save,由于该数据从来没有被保存过,所以弹出Save as对话框2008年11月30日1.2 数据的预分析1.2.1 数据的简单描述首先我们需要知道数据的基本情况,如均数、标准差等。选择Analyze=Descriptive Statistics=Descriptives菜单,系统弹出描述对话框如下:2008年11月30日该对话框可分为左右两大部分,左侧为所有可用的侯选变量列表,右侧为选入变量列表。我
6、们只需要描述X,用鼠标选中X,单击中间的,变量X的标签就会移入右侧,注意这时OK按钮变黑,表明已经可以进行分析了,单击它,系统会弹出一个新的界面如下所示:该窗口上方的名称为SPSS Viewer,即(结果)浏览窗口,整个的结构和资源管理器类似,左侧为导航栏,右侧为具体的输出结果。结果表格给出了样本数、最小值、最大值、均数和标准差这几个常用的统计量。从中可以看到,24个数据总的均数为1.2846,标准差为0.4687。2008年11月30日2008年11月30日我们以上的做法对吗?当然有问题!光看总的描述是不够的,还应当看看分组的描述情况。这里要用到文件分割功能,请切换回数据管理窗口,选择Dat
7、a=Split File菜单,系统弹出文件分割对话框如下:选择单选按钮Organize output by groups,将变量GROUP选入右侧的选入变量框,单击OK钮,此时界面不会有任何改变,但请再做一次数据描述,你就可以看到现在数据是分Group=1和Group=2两种情况在描述了!从描述可知两组的均数和标准差分别为1.5209、1.0846和0.4218、0.4221。如果定义了文件分割,则它会在以后的所有统计分析中起作用,直到你重新定义文件分割方式为止。2008年11月30日2008年11月30日1.2.2 绘制直方图统计指标只能给出数据的大致情况,没有直方图那样直观,我们就来画个直
8、方图瞧瞧!选择Graphs=Histogram,系统会弹出绘制直方图对话框如下:2008年11月30日将变量X选入Variable选择框内,单击OK按钮。此时结果浏览窗口内会绘制出如下两个直方图:2008年11月30日两组的数据没有特别偏的分布,也没有十分突出的离群值,因此无须变换,可以直接采用参数分析方法来分析。综合设计类型,最终确定采用成组设计两样本均数比较的t检验来分析。最后,我们还要取消变量分割,免得它影响以后的统计分析,再次调出变量分割对话框,选择单选按钮中的“Analyze all cases, do not creat group”,单击OK按钮就可以了。2008年11月30日1
9、.3 按题目要求进行统计分析下面我们要用SPSS来做成组设计两样本均数比较的t检验,选择Analyze=Compare Means=Independent-Samples T test,系统弹出两样本t检验对话框如下:2008年11月30日将变量X选入test框内,变量group选入grouping框内,注意这时下面的Define Groups按钮变黑,表示该按钮可用,单击它,系统弹出比较组定义对话框如右图所示:该对话框用于定义是哪两组相比,在两个group框内分别输入1和2,表明是变量group取值为1和2的两组相比。然后单击Continue按钮,再单击OK按钮,系统经过计算后会弹出结果浏览
10、窗口,首先给出的是两组的基本情况描述,如样本量、均数等(糟糕,刚才的半天工夫白费了),然后是t检验的结果如下:2008年11月30日Independent Samples TestLowerUpperEqual variancesassumed0.030.862.52220.0190.43630.1729 7.78E-020.7948Equal variancesnot assumed2.5221.40.020.43630.1729 7.72E-020.7954MeanDifferenceStd. ErrorDifference95% ConfidenceInterval of theXLev
11、enes Test forEquality of Variancest-test for Equality of MeansFSig.tdfSig. (2-tailed)下限上限假设方差齐0.0320.862.524220.0190.43630.1729 7.78E-020.7948假设方差不齐2.524 21.3530.020.43630.1729 7.72E-020.7954自由度P值(双侧)均数差值两均数是否相等的t检验差值的标准误差值的95%可信区间血磷值Levene方差齐性检验F值P值t值2008年11月30日可见该结果分为两大部分:第一部分为Levenes方差齐性检验,用于判断两总
12、体方差是否齐,这里的检验结果为F = 0.032,p = 0.86,可见在本例中方差是齐的;第二部分则分别给出两组所在总体方差齐和方差不齐时的t检验结果,由于前面的方差齐性检验结果为方差齐,第二部分就应选用方差齐时的t检验结果,即上面一行列出的t= 2.528,=21,p=0.019。从而最终的统计结论为按=0.05水准,拒绝H0,认为克山病患者与健康人的血磷值不同,从样本均数来看,可认为克山病患者的血磷值较高。2008年11月30日1.4 保存和导出分析结果1.4.1 保存结果文件显然,最方便快捷、最符合信息时代特征的就是第三种方法,在结果浏览窗口中(注意:一定要在结果浏览窗口中)选择菜单F
13、ile=Save,由于该结果也从来没有被保存过,所以弹出和前面保存数据时极为相似的一个Save as对话框,和前面相比,他唯一的区别就是文件的保存类型只有View Files(*.spo)一种。好,闲言少叙,在文件名框中键入“Li1_1”并回车,该结果文件就会按文件名Li1_1.spo被存储。2008年11月30日1.4.2 导出分析结果文件倒是保存了,但问题还没有完全解决:我们从来写文章什么的都用的是文字处理软件,尤其是WORD,可WORD不能直接读取SPO格式的文件,怎么办呢?没关系,SPSS提供了将结果导出为纯文本格式或网页格式的功能,在结果浏览窗口中选择菜单File=Export,系统
14、会弹出Exprot Output对话框如下2008年11月30日2008年11月30日最上方的Export下拉式列表可以选择输出的内容,可以为含图表的输出文档、无图表的输出文档和只有统计图表三种;中部的Exprot File对话框则填入输出的目标文件名;左下方的Export What单选框可以选择输出结果的哪些部分,可以是所有结果、所有可见结果或只输出选择的结果,一般选输出所有可见结果;右下方的输出文件类型下拉式列表已被我打开,可见里面有网页格式和纯文本格式两种,在一切按所需选择完毕后按OK钮,则结果文件就会输出为你想要的类型。好,到这里,就象我们刚开始所说的一样,你实际上已经完全掌握了SPS
15、S的基本使用方法。我们以后将要做的工作就是“百尺竿头,更进一步”,将从下一章开始详细介绍SPSS各个模块的精确用法,使大家能尽快的从SPSS新手向SPSS高手过度。2008年11月30日1.5 打开其他格式的数据文件1.5.1 直接打开直接打开SPSS现在可以直接读入许多格式的数据文件,其中就包括EXCEL各个版本的数据文件。选择菜单File=Open=Data或直接单击快捷工具栏上的“”按钮,系统就会弹出Open File对话框,单击“文件类型”列表框,在里面能看到直接打开的数据文件格式,分别是:SPSS(*.sav)SPSS数据文件(6.010.0版)SPSS/PC+(*.sys)SPSS
16、 4.0版数据文件Systat(*.syd)*.syd格式的Systat数据文件Systat(*.sys)*.sys格式的Systat数据文件SPSS portable(*.por)SPSS便携格式的数据文件EXCEL(*.xls)EXCEL数据文件(从5.0版2000版)Lotus(*.w*)Lotus数据文件SYLK(*.slk)SYLK数据文件dBase(*.dbf)dBase系列数据文件,(从dBase IIIV)Text(*.txt)纯文本格式的数据文件data(*.dat)纯文本格式的数据文件2008年11月30日1.5.2 使用数据库查询打开SPSS可以直接打开许多类型的数据文件
17、,但这并不是说它可以打开所有类型的数据文件(废话),比如FoxPro 3.0以上版本的*.dbf文件就不能直接打开(有兴趣的话你可以试试)。为此,SPSS还提供了另一个适用范围更广、但使用上较为专业的数据接口数据库查询。 实际上,SPSS在这里使用的是一种叫ODBC(Open Database Capture)的数据接口,该接口被大多数数据库软件和办公软件(如MS Office)支持,通过它,应用程序可以直接访问以结构化查询语言(SQL)做为数据访问标准的数据库管理系统。 由于SPSS 10.0可以直接打开EXCEL所有系列的数据文件,因此数据库查询接口的用处不是很大。但是,在9.0及以前的版
18、本中,该查询仍是直接打开EXCEL 95、97及2000数据文件的唯一办法。2008年11月30日ODBC数据引擎是独立与各种应用软件,直接安装到Windows系统中的,因此你所用的系统中ODBC所支持的数据类型取决于所安装的ODBC引擎的情况。还好,大多数支持该接口的软件都会在安装光盘上附送该引擎的安装文件(如MS Office)。不过有一点要提醒大家,许多机器的OBDC数据引擎安装有问题(尤其是D版),在SPSS中使用它往往要死机。选择菜单File=Open Database=New Query,系统会弹出数据库向导的第一个窗口,其中会列出你使用的机器上已安装的所有数据库驱动程序,选中所需
19、的数据源,然后单击下一步,向导会一步一步的提示你如何做,直至将数据读入SPSS。2008年11月30日1.5.3 使用文本导入向导读入文本文件选择菜单File=Read Text Data,系统就会弹出Open File对话框,对!和前面的情况完全一样,只是文件类型自动跳到了Text (*.txt)。实际上,该功能在SPSS中已被整合到了Open File对话框中之所以在菜单上保留该条目有两个原因:1. 读入纯文本的情况非常普遍,放在这里更加醒目;2. 为了和SPSS老版本的使用上保持兼容。例2.1 现有一数据文件以纯文本的形式存为“c:Li2_1.txt”,且第一行为变量名,请将其读入SPS
20、S。解:在Open File对话框选中相应的文件名并单击“确定”,系统会自动启动文本导入向导对话框如下:2008年11月30日2008年11月30日1.6编辑数据文件在SPSS中,数据文件的编辑、整理等功能被集中在了Data和Transform两个菜单项中,这两个菜单的内容如下所示:Data菜单项Transform菜单项2008年11月30日1.6.1定义新变量直接定义新变量 大多数情况下我们需要从头定义变量,在SPSS 10.0中,定义变量只需单击左下方的Variable View标签就可以切换到变量定义界面开始定义新变量。如Li1_1.sav的变量定义如下所示:2008年11月30日以变量
21、x为例:变量名为x,类型为Numeric,宽度为4,小数位数2位(因小数点还要占一位,故整数位只有一位),变量标签位为“血磷值”。右侧在图中未能看到的依次为Values,用于定义具体变量值的标签;Missing,用于定义变量缺失值;Colomns,定义显示列宽;Align,定义显示对齐方式;Measure,定义变量类型是连续、有序分类还是无序分类。使用该窗口,我们可以一次定义许多新变量,不会象老版本那样一个一个的定义了。2008年11月30日标签 和老版本不同,现在变量标签和变量值标签被分开设置,变量标签就在Label框中直接输入,变量值标签则在它右侧的Value框定义。以group为例,单击
22、Value框右半部的省略号,会弹出变量值标签对话框如右:上部的两个文本框分别为变量值输入框和变量值标签输入框,分别在其中输入“1”和“克山病患者”,此时下方的Add钮变黑,单击它,该变量值标签就会被加入下方的标签框内。与此类似定义变量值“2”为“健康人”,最后按OK,变量值标签就设置完成。此时你做任何分析,在结果中都有相应的标签出现。如果你现在就想看效果,切换回Data View界面,然后选择菜单View=Value Labels,怎么样,看到了吗?2008年11月30日缺失值 单击missing框右侧的省略号,会弹出缺失值对话框如下:界面上有一列三个单选钮,默认值为最上方的“无缺失值”;第二
23、项为“不连续缺失值”,最多可以定义3个值;最后一项为“缺失值范围加可选的一个缺失值”2008年11月30日Compute Variable对话框 这主要用于对原变量通过一定的计算,产生新变量的方法。n例3.2 在li1_1.sav中建立新变量temp,令其值当血磷值大于1时为2,否则为1。首先给变量temp均赋值为1,然后将血磷值大于1的记录其temp变量值改为2即可。第一步:选择菜单Transform=Compute,弹出Compute Variable对话框如下:2008年11月30日左上角为需要计算的变量名,在其中键入“temp”,此时“Type&Lable”按钮就会变黑,喜欢精确的朋友
24、可以在这里对temp进行详细的定义;左下方为候选变量列表,现在还用不着;中部为类似计算器的软键盘,可以用鼠标按键输入数字和符号,这里我们直接输入“1”,输入的内容回立刻在右上方的数值表达式窗口中出现;软键盘右侧为函数窗口,可以在这里找到并使用所需的SPSS函数;这次也用不到。好,现在“OK”按钮已经变黑,单击他,系统就会自动生成一个新变量temp,并且取值均为1。2008年11月30日第二步,再次选择菜单Transform=Compute,系统也再次弹出这个对话框,将数值表达式窗口中的1改为2,然后单击中下部的“If”按钮,系统弹出记录选择对话框如下:2008年11月30日Count对话框Co
25、unt对话框用于计算某个值或某些值在某个变量的取值中是否出现(好象有点拗口),比如我们想看看有哪些记录的血磷值在23之间,选择菜单Transform=Count,系统弹出Count对话框如下:2008年11月30日2008年11月30日Target Variable框中用于指定记录变量值是否出现的变量名,在这里输入temp2;选中血磷值(x),将其选入Variables窗口,此时“Define Values”按钮变黑,单击它,系统弹出变量值定义窗口如下:2008年11月30日左半部为变量值定义窗口,可以定义某个值、系统缺失值、系统或用户定义缺失值、变量值范围、小于某值或大于某值。我们这里是第四
展开阅读全文