第二章-描述性统计分析SPSS应用课件.ppt

上传人（卖家）：晟晟文业

文档编号：4294220

上传时间：2022-11-26

格式：PPT

页数：100

大小：766.84KB

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

28 文币

交易提醒：下载本文档，相应价格的文币将全额进入上传人（卖家）的账号。立即下载优惠套餐（点此详情）

【下载声明】
1. 本站全部试题类文档，若标题没写含答案，则无答案；标题注明含答案的文档，主观题也可能无答案。请谨慎下单，一旦售出，不予退换。
2. 本站全部PPT文档均不含视频和音频，PPT中出现的音频或视频标识（或文字）仅表示流程，实际无音频或视频文件。请谨慎下单，一旦售出，不予退换。
3. 本页资料《第二章-描述性统计分析SPSS应用课件.ppt》由用户（晟晟文业）主动上传，其收益全归该用户。163文库仅提供信息存储空间，仅对该用户上传内容的表现方式做保护处理，对上传内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知163文库（点击联系客服），我们立即给予删除！
4. 请根据预览情况，自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器，压缩文件请下载最新的WinRAR软件解压。

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 第二描述统计分析 SPSS 应用课件

资源描述：: 1、第二章描述性统计分析主要内容统计分析和研究的特点统计分析和研究的特点单变量的描述性统计单变量的描述性统计频数分析频数分析描述性分析描述性分析探索性分析探索性分析一、统计分析和研究的特点大量观察、建立数据库描述统计：用统计学来简化数据，描述特征和关系。推论统计：用统计学可以从局部（样本）来推论总体的情况。二、单变量的基本描述技术二、单变量的基本描述技术一般来说，原始的资料往往是杂乱无章一般来说，原始的资料往往是杂乱无章的。零散地分布在问卷和文献中，因此的。零散地分布在问卷和文献中，因此必须对资料进行加工必须对资料进行加工对资料的加工和分析从单变量的分析开对资料的加工和分析从单变量的分析开始。始。
2、单变量的特征包括分布、统计表和统计单变量的特征包括分布、统计表和统计图图分布特征如何？频数频数(Frequency)百分比（百分比（percent）对比值对比值(ratio)累计频数（累计频数（Cumulative Frequency）累计百分比（累计百分比（cumulative percent）基本技术之统计表表号表号在文章中便于查阅、引用。在文章中便于查阅、引用。表头，包括标题、时间和地点表头，包括标题、时间和地点纵栏标题纵栏标题横行标题横行标题总计行总计行（一）定类层次（一）定类层次1.1.频数与频数分布频数与频数分布(1).(1).频数频数(f frequency)requency)：
3、也称次数，它是归属各类：也称次数，它是归属各类别的个案数。别的个案数。(2)(2)频数分布频数分布(frequency distribution)(frequency distribution)：把各：把各个类别及其相应的频数全部列出，并用表格形个类别及其相应的频数全部列出，并用表格形式表示出来，就是频数分布。这个表格就是频式表示出来，就是频数分布。这个表格就是频数分布表。数分布表。o 频数分布表通过对原始资料的初步简化，可频数分布表通过对原始资料的初步简化，可以简洁明了地反映原始数据的情况。但是因以简洁明了地反映原始数据的情况。但是因为样本规模的不同，通常不能直接用来比较为样本规模的不同，通
4、常不能直接用来比较信息，为什么？信息，为什么？2.百分比百分比(percent)：频率：频率社会统计中通常用百分比来表示，绘制的表格一社会统计中通常用百分比来表示，绘制的表格一般是百分比表，但表的最下一行一般要注明频般是百分比表，但表的最下一行一般要注明频数。数。上表上表1中，已婚者与各机关人数的比例分别是：中，已婚者与各机关人数的比例分别是：o 甲机关：甲机关：乙机关：乙机关：甲、乙机关已婚者所占的百分比分别是甲、乙机关已婚者所占的百分比分别是65.0%和和57.1%，11300.650200p22000.571350po 如果只看次数，乙机关已婚者远高于甲机关，如果只看次数，乙机关已婚者远
5、高于甲机关，但从百分比来看，甲机关已婚的比例则较大。但从百分比来看，甲机关已婚的比例则较大。o 频数分布表是不同类别的绝对数量的分布情况，频数分布表是不同类别的绝对数量的分布情况，百分比分布表则是不同类别在总体中的相对数百分比分布表则是不同类别在总体中的相对数量分布，因此，百分比分布除具备频数分布的量分布，因此，百分比分布除具备频数分布的特点外，还可以十分方便地进行不同总体或不特点外，还可以十分方便地进行不同总体或不同类别之间的比较，应用更为广泛。同类别之间的比较，应用更为广泛。o 3.对比值对比值(ratio)：不同类别数值之间的比：不同类别数值之间的比值，用值，用x:y的形式表示的形式表示
6、如出生性别比为如出生性别比为105:100，则表示每出生，则表示每出生100个女孩则有个女孩则有105个男孩出生个男孩出生某班男女生比率为某班男女生比率为3：5（二）定序层次：累积频数和累积频率（二）定序层次：累积频数和累积频率累积频数累积频数(cumulative frequencies)：将各有序类别或组的频数逐级累加起来。将各有序类别或组的频数逐级累加起来。累积频率累积频率(cumulative percentages)：就是将各有序类别或组的百分比逐渐累加就是将各有序类别或组的百分比逐渐累加起来。起来。作用：使我们容易知道某值以下或以上的次作用：使我们容易知道某值以下或以上的次数或百
7、分比之和数或百分比之和(1)向上累积向上累积:从类别顺序的开始的一方向类别顺序的从类别顺序的开始的一方向类别顺序的最后一方累加频数（由低级向高级水平的加和）最后一方累加频数（由低级向高级水平的加和）(2)向下累积向下累积o 从类别顺序的最后一方向类别顺序的开始的一从类别顺序的最后一方向类别顺序的开始的一方累加频数。（由高级或大数值一方向低级或方累加频数。（由高级或大数值一方向低级或较小数值一方的累加）较小数值一方的累加）如：某校学生的家庭月收入如：某校学生的家庭月收入收入收入(元元)fCfCf500-6991010550700-8996575540900-10991262114751100-1
8、2991583693391300-14991415101811500-16994055040总数总数 550(三三)定距层次定距层次:分组与组距分组与组距1、分组是根据统计研究的需要，将数据按照某种、分组是根据统计研究的需要，将数据按照某种标准化分成不同的组别，分组后再计算出各组标准化分成不同的组别，分组后再计算出各组中出现的频数或频率，形成一张统计分析表。中出现的频数或频率，形成一张统计分析表。（1）组限：每组的范围，）组限：每组的范围，o 包括上限（包括上限（Upper limit）和下限（）和下限（lower limits）o 如如100-200，下限就是，下限就是100，上限就是，上限
9、就是200（2）分组遵循的两大原则）分组遵循的两大原则o“不重不漏不重不漏”的原则的原则“不重不重”是指一项数据只能分在其中的某一组，不能是指一项数据只能分在其中的某一组，不能在其他组中重复出现。在其他组中重复出现。“不漏不漏”是指组别能够穷尽，及在所分的全部组别中是指组别能够穷尽，及在所分的全部组别中某项数据都能分在其中的一组，不能遗漏。某项数据都能分在其中的一组，不能遗漏。o“上组界不包括在内上组界不包括在内”的原则的原则（3）组距：是一个组的上限与下限的差）组距：是一个组的上限与下限的差,o 可根据全部数据的最大值和最小值及所分的可根据全部数据的最大值和最小值及所分的组数来确定组数来确定
10、o 组距组距=(最大值最大值-最小值最小值)/组数组数组距组距=真实上限真实上限-真实下限真实下限(李沛良书李沛良书p41-42)数据的分组，通过数据的分组，通过“transform”“recode”命令命令完成完成（4）组中值：处于一组中间位置的值）组中值：处于一组中间位置的值o 真实上限与真实下限的平均值真实上限与真实下限的平均值组中值组中值=（上限（上限+下限）下限）/2如，如，100-200，200-300，300-400分组分组数据的组中值：数据的组中值：150，250，350那么那么100-199，200-299，300-399分组分组的组中值是多少？的组中值是多少？基本技术之
11、统计图基本技术之统计图o 饼图饼图条形图条形图o直方图直方图o 直方图是以长条的面直方图是以长条的面积（长与宽的乘积）积（长与宽的乘积）来表示频数或相对频来表示频数或相对频数；条形的长度，即数；条形的长度，即纵轴高度表示单位组纵轴高度表示单位组距所含有的所有频数距所含有的所有频数或相对频数的密度。或相对频数的密度。仅适用于定距及以上仅适用于定距及以上层次的变量层次的变量 o 折线和曲线图折线和曲线图定距变量资料分布常用曲线定距变量资料分布常用曲线o J形曲线U形曲线形曲线峰状曲线峰状曲线对称与不对称曲线对称与不对称曲线o 注意：适用于较低测量层次的统计法，也适注意：适用于较低测量层次的统计法，
12、也适用于较高的层次。用于较高的层次。o 图形也同样：饼图主要是用于定类变量图形也同样：饼图主要是用于定类变量条形图主要是用于定序变量；直方图、折线图条形图主要是用于定序变量；直方图、折线图等主要是用于定距变量等主要是用于定距变量练习：城镇自杀率的分组次数分布练习：城镇自杀率的分组次数分布自杀率自杀率次数次数组中值组中值向上累积次数向上累积次数3-5126-8359-118112-145215-173018-20721-23923-263合计合计229三、集中趋势测量用分布来研究单变量是最全面的分析方法在很多情况下，我们只要了解其大概或分布的主要特征以便简化资料。于是就产生了用某一个典型的变量值
13、或特征值来代表全体变量的问题，这个典型的变量值或特征值就是集中值或集中趋势。统计分析统计分析首先要解决的问题，就是寻求首先要解决的问题，就是寻求一个简单数值以代表搜集所得的资料。一个简单数值以代表搜集所得的资料。下面是一个小故事：一个人到某公司求职，经过调查，得出关于该公司工资的一些数据，如果是你，应该如何选择？挠头的数值挠头的数值公司员工的月薪如下：公司员工的月薪如下：员工员工经理经理副经副经理理职员职员A职员职员B职员职员C职员职员D职员职员E职员职员F职员职员G月薪月薪（元）（元）60004000170013001200110011001100500我们有三种方法选择集中趋势：（1）根据
14、频数：哪个变量值出现次数越多，就选择哪个变量值，比如民主决策的表决机制。（2）根据居中：比如一个城镇居民的生活水平，居中的是小康家庭，那么就用小康家庭来代表该城镇的生活水平。（3）根据平均：用平均数来代表变量的平均水平。关于集中趋势的一个故事n吉斯莫先生有一个小工厂，生产超级小玩意儿。n管理人员由吉斯莫先生、他的弟弟、六个亲戚组成。工作人员由5个领工和10个工人组成。工厂经营得很顺利，现在需要一个新工人。n现在吉斯莫先生正在接见萨姆，谈工作问题。n吉斯莫：我们这里报酬不错。平均薪金是每周300美元。你在学徒期间每周得75美元，不过很快就可以加工资。n萨姆工作了几天之后，要求见厂长。n萨姆；你欺
15、骗我！我已经找其他工人核对过了，没有一个人的工资超过每周100元。平均工资怎么可能是一周300元呢？n吉斯莫：啊，萨姆，不要激动。平均工资是300元。我要向你证明这一点。n吉斯莫：这是我每周付出的酬金。我得2400元，我弟弟得1000元，我的六个亲戚每人得250元，五个领工每人得200元，10个工人每人100元。总共是每周6900元，付给23个人，对吧？n萨姆：对，对，对！你是对的，平均工资是每周300元。可你还是蒙骗了我。n吉斯莫；我不同意！你实在是不明白。我已经把工资列了个表，并告诉了你，工资的中位数是200元，可这不是平均工资，而是中等工资。n萨姆：每周100元又是怎么回事呢？n吉斯莫：
16、那称为众数，是大多数人挣的工资。n吉斯莫：老弟，你的问题是出在你不懂平均数、中位数和众数之间的区别。n萨姆：好，现在我可懂了。我我辞职！描述集中趋势的统计量描述集中趋势的统计量Mean（均值）Median（中位值）Mode（众值）（一）均值（定距变量）1.对于未分组资料对于未分组资料例例求求74、85、69、9l、87、74、69这些数这些数字的算术平均数。字的算术平均数。解解 78.4 NXXNXX769748791698574 2.对于分组资料对于分组资料很显然，算术平均数不仅受各变量值很显然，算术平均数不仅受各变量值(X)大小的影大小的影响，而且受各组单位数响，而且受各组单位数(频数
17、频数)的影响。由于对于总体的影的影响。由于对于总体的影响要由频数响要由频数(f)大小所决定，所以大小所决定，所以 f 也被称为权数。值得也被称为权数。值得注意的是，在统计计算中，权数不仅用来衡量总体中各标注意的是，在统计计算中，权数不仅用来衡量总体中各标志值在总体中作用，同时反映了指标的结构，所以它有两志值在总体中作用，同时反映了指标的结构，所以它有两种表现形式：绝对数（频数）和相对数（频率）。种表现形式：绝对数（频数）和相对数（频率）。PXffXX 例例求下表求下表(单项数列单项数列)所示数据的算术平所示数据的算术平均数均数。人口数（人口数（X）户数户数(f)频率频率(P)23456785
18、816106410.100.160.320.200.120.080.02合计合计501.00 对于对于组距数列组距数列，要用每一组的组中值权充该，要用每一组的组中值权充该组统一的变量值。组统一的变量值。例例求下表所示数据的算术平均数求下表所示数据的算术平均数 f X fX间距频数（f）组中值（X)148152152156156160160164164168168172172176176180180184184188188192192196 1 2 51019251712 5 3 0 1 150154158162166170174178182186190194合计 100 3.的性质的性质各变
19、量值与算术平均数的离差之和等于各变量值与算术平均数的离差之和等于0。各变量值对算术平均数的平方和，小于它们对任各变量值对算术平均数的平方和，小于它们对任何他数偏差的平方和何他数偏差的平方和算术平均数受抽样变动影响较小。算术平均数受抽样变动影响较小。分组资料如遇有开放组距时，不经特殊处理分组资料如遇有开放组距时，不经特殊处理不能进行算术平均数的计算。不能进行算术平均数的计算。受极端值影响较大。受极端值影响较大。（二）中位值（定序变量、定距变量）定义：第50百分位数上的值，即有50%的观察点落在这个值之下。根据原始资料求中位值:将各个案由低至高排列起来，居于序列中央位置的个案的值即为中位值。观察总
20、数为奇数：Md=(N+1)/2 当观察总数为偶数：将位于最中央位置的两个数值的平均值作为中位值。1.对未分组资料对未分组资料 n例求54，65，78，66，43这些数字的中位数。n例、求54，65，78，66，43，38 这些数字的中位数。你会吗？2.对于分组资料：对于分组资料：（1）单项数列单项数列根据根据N/2在累计频数分布中找到中位数所在组，在累计频数分布中找到中位数所在组，该组变量值就是该组变量值就是。中位数XfF333491252537634717209187989199101100合计合计100（2）组距数列）组距数列（2）组距数列）组距数列按中位数所在组的下限：按中位数所在组
21、的上限：hfFNLMmmd12/hfNFUMmmd2/hfNFUMmmd2/hfNFUMmmd2/例例某年级学生身高如下，求中位数某年级学生身高如下，求中位数组距fF150156331561629121621682537168174347117418020911801867981861921991921981100合计100 解第一种方法 168 6 17112(厘米)25372/10025372/10025372/100请你用第二种方法来做一下hfFNLMmmd12/3.中位数的性质中位数的性质 (1)各变量值对中位数之差的绝对值总和，小于它们对任何其他数的绝对值总和。(2)中位数不受极端
22、值的影响。(3)分组资料有不确定组距时，仍可求得中位数。(4)中位数受抽样变动的影响较算术平均数略大。4.四分位数中位数所有单位被等分为两部分，因而被称为二分中位数所有单位被等分为两部分，因而被称为二分位数。类似于求中位数，我们还可求出位数。类似于求中位数，我们还可求出四分位数、十分四分位数、十分位数、百分位数。位数、百分位数。将总体中的各单位分割成相等的四部分，则这三个将总体中的各单位分割成相等的四部分，则这三个分割的变量值就是四分位数。若以分割的变量值就是四分位数。若以Q1、Q2、Q3分别代表分别代表第一、第二、第三四分位数。第一、第二、第三四分位数。Q2 即中位数，即中位数，Q1、Q3
23、的算的算法分别是法分别是333334/3hfFNlQ333334/3hfFNlQ111114/hfFNlQ请从下表中指出第一四请从下表中指出第一四分位数和第三四分位分位数和第三四分位数数X f F 3 3 3 4 9 12 5 25 37 6 34 71 7 20 91 8 7 98 9 1 99 10 1 100 合计合计 100 XfF333491252537634717209187989199101100合计合计100 求出下表中的第一四分位数和第三四分数求出下表中的第一四分位数和第三四分数组距组距fF1501563315616291216216825371681743471174180
24、20911801867981861921991921981100合计合计100（三）众数(Mode)众数只与次数有关，可以用于定类、众数只与次数有关，可以用于定类、定序、定距、定比资料。定序、定距、定比资料。1.对于未分组资料对于未分组资料直接观察首先，将所有数据顺序排列；然后，只要观察到某些变量值(与相邻变量值相比较)出现的次数(或频数)呈现“峰”值，这些变量值就是众数。2.对于分组资料对于分组资料单项式：单项式：观察频数分布(或频率分布)组距式：组距式：Lo为众数组下限；为众数组频数与前一组频数之差；为众数组频数与后一组频数之差；ho为众数组组距。oohLM211人口数（人口数（X）
25、户数户数(f)频率频率(P)23456785816106410.100.160.320.200.120.080.02合计合计501.00求下表中的众数求下表中的众数众众数数求下表中的众数求下表中的众数组距组距fF150156331561629121621682537168174347117418020911801867981861921991921981100合计合计100 (1)众数仅受上下相邻两组频数大小的影响，不受极众数仅受上下相邻两组频数大小的影响，不受极端值影响，对开口组仍可计算众数；端值影响，对开口组仍可计算众数；(2)受抽样变动影响大；受抽样变动影响大；(3)众数不唯一确定。众数
26、不唯一确定。(4)众数标示为其峰值所对应的变量值，能很容易区众数标示为其峰值所对应的变量值，能很容易区分出单峰、多峰。因而具有明显偏态集中趋势的频数分分出单峰、多峰。因而具有明显偏态集中趋势的频数分布，用众数最合适。布，用众数最合适。3.众数的性质众数的性质四、离散趋势测量四、离散趋势测量n 所谓离散趋势，是指数列中各变量值之间的差距和离散程度。离势小，平均数的代表性高；离势大，平均数代表性低。例如有例如有A、B、C三组学生各三组学生各5人的成绩人的成绩如下：如下：A组：组：60，60，60，60，60 B组：组：58，59，60，61，62 C组：组：40，50，60，70，80 数据显示，
27、平均数相同，离势可能不数据显示，平均数相同，离势可能不同；平均数不同，离势可能相同。同；平均数不同，离势可能相同。描述离散趋势的统计量描述离散趋势的统计量异众比极差四分位差方差标准差 1、Variation ratio（异众比）界定：异众比也称离异比率，一般用异众比来反映不同于众值的数在全体数值中所占的比例，用于测量定类变量的离散趋势。计算公式：异众比=（N众值的频次）/N2、Range（极差）Range 也称全距或范围，即最大值与最小值之间的距离，显示的是数据分布的范围，但对于中间部分数据怎么变化，则不能推知，此外，它受极端值的影响大。3、四分位差：适用于定序变量界定：也叫四分位数偏差或四分
28、互差。通常数据按从小到大的顺序排列后，用三个四分位数点Q1、Q2、Q3将其分成四部分。Q1是第25百分位数点或叫低四分位数点；Q2是第50百分为位数点即中位数；Q3是第75百分位数点或叫高四分位数点。四分位差规定为Q1和Q3之间的距离。计算公式：Q=Q3 Q1 Q越大，表示有50%的个案的分布越是远离中位值，中位值的代表性就越小，以中位值作为估计或预测的效果就越差。Q越小，说明数据比较集中在中位值附近4、Variance（方差）：适用于定距变量方差（观察值均值）的平方和/n一般方差越大，说明观察值离平均值的距离越远，数据的离散程度也越大。5、Std.deviation（标准差）Std.devi
29、ation为Standard Deviation的简写，表示以均值做估计或预测变量时所犯错误的大小。总体的标准偏差=根号（观察值均值）的平方和/n SPSS应用频数分析频数分析描述性分析描述性分析探索性分析探索性分析频数分析n1频数分析目的和主要功能n 频数就是一个变量在各个变量值上取值的个案数，基本统计分析往往从频数分析开始。通过频数分析能够了解变量取值的状况，对把握数据的分布特征是非常有用的。n 例如，调查消费者拥有数码产品的数量，首先分析受访者的总人数、家庭收入情况、受教育程度、性别等，获取样本是否具有总体代表性、抽样是否存在系统偏差等信息。这些可以通过频数分析来实现。n经过频数分析可以
30、得到如下结果：n（1）频数分布表：该表中包含频数、各频数占总样本数的百分比、有效百分比、累计百分比。n（2）统计图：用统计图形展示变量的取值状况，频数分析中提供的统计图形可以是条形图、饼图或者直方图。2频数分析过程的操作界面频数分析过程的操作界面n（1）候选变量框）候选变量框n列出数据文件中所有的变量列出数据文件中所有的变量n（2）Variables框框n从候选变量框中选择要分析的变量从候选变量框中选择要分析的变量n移入此框中，可同时选择多个变量，移入此框中，可同时选择多个变量，n此时，此时，SPSS就将分别产生多张就将分别产生多张n频数表或统计图形。频数表或统计图形。n（3）Display
31、frequency tables复选框复选框n此复选框设置是否显示频数表，此复选框设置是否显示频数表，n系统默认选中，表示要显示频数表。系统默认选中，表示要显示频数表。图2-12频数分析过程的操作界面频数分析过程的操作界面n（4）Statistics按钮按钮n单击该按钮会弹出新的对话框，单击该按钮会弹出新的对话框，n该对话框主要用于确定将要在该对话框主要用于确定将要在n输出结果中出现的统计量，输出结果中出现的统计量，n选中统计量前的复选框表示选中统计量前的复选框表示n输出该统计量。输出该统计量。n（5）Charts按钮按钮n用于确定将输出的图形类型用于确定将输出的图形类型n和图形取值。和图形取
32、值。n（6）Format按钮按钮n定义输出频数表的格式定义输出频数表的格式图2-13实例分析实例分析n【例例1】以下是调查问卷中针对被调查人设置的两个问题：以下是调查问卷中针对被调查人设置的两个问题：n1、您的家庭月收入大约是：（请包括所有工资、奖金、津贴等在内，以人民币为单位）单选 n500-1000.11000-19992n2000-299933000-39994 n4000-499955000-59996n6000-699977000-79998n8000-899999000-999910n10000及以上11n2、您的教育程度：（指您受过的最高或正在接受的教育程度）单选n没有受过正式教
33、育/小学.1初中2高中/中专/技校3n大专/大学非本科/高职高专4大学本科5研究生及以上.6 n从问卷中收集到的数据如表2.1所示 3实例分析实例分析n试对收集到的数据进行频数分析家庭月收入受教育程度35152515156410545表2.13实例分析实例分析第第1步步数据组织；数据组织；n根据表根据表2.1生成生成SPSS数据文件，建数据文件，建2个变量：个变量：“收入收入”、“教教育育”。第第2步步打开主对话框；打开主对话框；n选择选择Analyze Descriptive Statistics Frequencies，打开，打开同图同图2-1一样的频数分析主对话框。一样的频数分析主
34、对话框。第第3步步确定要输出的统计量；确定要输出的统计量；n单击单击Statistics按钮，在按钮，在Statistics子对话框中选择子对话框中选择Mode（众（众数）统计量。数）统计量。第第4步步确定要输出的统计图形；确定要输出的统计图形；n单击单击Charts按钮，在按钮，在Charts子对话框中选择子对话框中选择Histograms（直（直方图）方图）运行结果及分析。运行结果及分析。n3实例分析实例分析FrequencyPercentValid PercentCumulative PercentValid181.01.01.02394.74.75.6311413.613.719.
35、3416519.719.839.0545654.554.693.76536.36.3100.0Total83599.9100.0MissingSystem1.1Total836100.0图2-2 变量“教育”的直方图表2.2 变量“教育”的频数分布表描述性分析描述性分析n1描述性分析目的和主要功能描述性分析目的和主要功能n描述性分析主要用于输出变量的各类描述性描述性分析主要用于输出变量的各类描述性统计量的值，通过上一节的学习可知，频数统计量的值，通过上一节的学习可知，频数分析同样可以做到，都是以计算数值型单变分析同样可以做到，都是以计算数值型单变量的统计量为主。描述性统计分析没有图形量的统计量
36、为主。描述性统计分析没有图形功能，也不能生成频数表，但描述性分析可功能，也不能生成频数表，但描述性分析可以将原始数据转换成标准正态评分值，并以以将原始数据转换成标准正态评分值，并以变量形式存入数据文件中，以便后续分析时变量形式存入数据文件中，以便后续分析时应用。应用。2描述性分析的操作界面描述性分析的操作界面n 列出数据文件中的变量，从中选择要作描述性分析的变量将需作描述性分析的变量选入此框中，可同时选择多个变量，此时，SPSS就将分别产生多个变量的描述性分析结果点击Option按钮设置需计算的描述性统计量。图2-33实例分析实例分析n【例例2】n 选择选择“身高身高”变量作描述性分析，选定
37、要计算的统计量后，变量作描述性分析，选定要计算的统计量后，运算得到表运算得到表2.3所示的结果所示的结果表表2.3 NMinimumMaximumMeanStd.DeviationSkewness（偏度）Kurtosis（峰度）StatisticStatisticStatisticStatisticStatisticStatisticStd.ErrorStatisticStd.Error身高9699.3125.0109.8915.9633.350.246-.446.488Valid N(listwise)96探索性分析探索性分析n1探索性分析目的和主要功能探索性分析目的和主要功能 n 与前面介
38、绍的两种分析方法相比，探索性分析更加强大，与前面介绍的两种分析方法相比，探索性分析更加强大，它是对数据的探索和考察，可以对变量进行更为深入详尽的它是对数据的探索和考察，可以对变量进行更为深入详尽的统计分析。在进行统计分析前，通常需要寻求和确定适合所统计分析。在进行统计分析前，通常需要寻求和确定适合所研究的问题的统计方法，研究的问题的统计方法，SPSS提供的探索性分析是解决此提供的探索性分析是解决此类问题的有效办法。类问题的有效办法。n 探索性分析提供了很多关于数据的探索性分析提供了很多关于数据的概括分析概括分析和和图表直观图表直观描述描述的方法，不仅对个案数据有效，而且还可以针对分组个的方法，
39、不仅对个案数据有效，而且还可以针对分组个案。在输出常用描述性统计量的基础之上，探索性分析增加案。在输出常用描述性统计量的基础之上，探索性分析增加了有关了有关数据详细分布特征数据详细分布特征的文字与图形表述，如茎叶图、箱的文字与图形表述，如茎叶图、箱图等，显得更加详细、完整，还可以以方差齐性为目的的变图等，显得更加详细、完整，还可以以方差齐性为目的的变量交换提供线索，量交换提供线索，有助于用户制定更进一步分析的方案。有助于用户制定更进一步分析的方案。n 2探索性分析的操作界面探索性分析的操作界面（1）Depend List框框选择待分析的变量，可以选择待分析的变量，可以同时选择多个变量。注意：
40、同时选择多个变量。注意：选择的变量必须是数值型选择的变量必须是数值型变量变量（2）Factor List框框选择分组变量，根据该变选择分组变量，根据该变量的取值不同，分组分析量的取值不同，分组分析Dependlist框中的变量。框中的变量。可以不选，也可以多选。可以不选，也可以多选。（3）statistics按钮：设按钮：设置输出的统计量；置输出的统计量；Plots按钮：设置输出的图按钮：设置输出的图形；形；Option按钮：设置缺失值按钮：设置缺失值的处理。的处理。图2-43实例分析实例分析n【例3】表2-4是2007年各地区人口出生率和死亡率的统计数据，试对其作探索性分析并做是否服从正态分
41、布的检验。表2-4各地区人口自然变动情况出生率6.267.6712.8211.489.876.407.677.577.479.3610.29死亡率4.976.076.595.735.915.305.005.185.897.085.42出生率9.0811.9211.7814.4414.599.909.1413.9713.2017.4010.19死亡率5.956.734.496.105.736.506.286.716.305.706.15出生率12.6012.0013.8011.6011.5912.8615.2415.5315.79死亡率6.305.756.016.106.276.626.274
42、.845.033实例分析实例分析第1步数据组织；n根据表4.4生成SPSS数据文件，建2个变量：“出生率”、“死亡率”第2步打开主对话框；n选择Analyze Descriptive Statistics Explore，选择变量“出生率”、“死亡率”移入“Dependent List”文本框中。3实例分析实例分析第3步确定探索性分析的描述统计量；单击Statistics按钮，在Statistics子对话框（图4-5）中选择Descriptives 复选框、M-estimators复选框，单击Continue返回主对话框。图2-53实例分析实例分析第4步确定探索性分析输出的统计图形；n
43、单击Plots按钮，在如图2-6的Plots子对话框中选择“Dependents together”（不同因变量显示在一个箱图中）、“Stem-and-leaf”（茎叶图）、Normality Plots with tests（正态分布检测统计图）。单击Continue返回主对话框。图2-63实例分析实例分析结果分析n 表2-5 描述性统计量3实例分析实例分析结果分析n 表2-6 M估计值3实例分析实例分析结果分析n 分别利用Kolmogorov-Smimov检验和Shapiro-Wilk检验两种方法来确定变量是否服从正态分布。其中，Statistic表示检验统计量的值，df代表自由度，Si
44、g.表示显著性水平。一般来说，Sig.0.05则代表接受零假设，即接受变量服从正态分布的假设。本例中，两个变量的两种方法的Sig.值均大于0.05，因此两个变量均服从正态分布。表2-7 正态检验结果3实例分析实例分析结果分析n 图2-7 箱图3实例分析实例分析结果分析n 图2-8 出生率QQ趋势图Q-Q图可以用来检验数据是否服从某种分布，在Q-Q图中，检验数据是否较好地服从给定分布的标准有两个：看Q-Q图上的数据点与直线的重合度；Q-Q趋势图上的点是否关于直线Y=0在较小的范围内上下波动。4.4 探索性分析探索性分析n3实例分析实例分析结果分析n 图2-9 出生率QQ图3实例分析实例分析结果分
45、析n 茎叶图利用原始数据以图形的形式表现了分布的形状，图中包括频数（Frequency）、茎（Stem）和叶（Leaf）3部分，右图中的下方说明中给出了本图的茎宽为10，每片叶子代表一个数据。对应图中的第一行数据，从左到右依次为：频数为6，茎为0，有6片叶子。也就是指第一组里包含6个数据，其近似值为：6、6、7、7、7、7 图2-10 出生率茎叶图出生率 Stem-and-Leaf Plot Frequency Stem&Leaf 6.00 0.667777 5.00 0.99999 7.00 1.0011111 7.00 1.2222333 5.00 1.44555 1.00 1.7 Ste
46、m width:10.00 Each leaf:1 case(s)11醉翁亭记 1反复朗读并背诵课文，培养文言语感。2结合注释疏通文义，了解文本内容，掌握文本写作思路。3把握文章的艺术特色，理解虚词在文中的作用。4体会作者的思想感情，理解作者的政治理想。一、导入新课范仲淹因参与改革被贬，于庆历六年写下岳阳楼记，寄托自己“先天下之忧而忧，后天下之乐而乐”的政治理想。实际上，这次改革，受到贬谪的除了范仲淹和滕子京之外，还有范仲淹改革的另一位支持者北宋大文学家、史学家欧阳修。他于庆历五年被贬谪到滁州，也就是今天的安徽省滁州市。也是在此期间，欧阳修在滁州留下了不逊于岳阳楼记的千古名篇醉翁亭记。接下来就
47、让我们一起来学习这篇课文吧！【教学提示】结合前文教学，有利于学生把握本文写作背景，进而加深学生对作品含义的理解。二、教学新课目标导学一：认识作者，了解作品背景作者简介：欧阳修(10071072)，字永叔，自号醉翁，晚年又号“六一居士”。吉州永丰(今属江西)人，因吉州原属庐陵郡，因此他又以“庐陵欧阳修”自居。谥号文忠，世称欧阳文忠公。北宋政治家、文学家、史学家，与韩愈、柳宗元、王安石、苏洵、苏轼、苏辙、曾巩合称“唐宋八大家”。后人又将其与韩愈、柳宗元和苏轼合称“千古文章四大家”。关于“醉翁”与“六一居士”：初谪滁山，自号醉翁。既老而衰且病，将退休于颍水之上，则又更号六一居士。客有问曰：“六一何谓
48、也？”居士曰：“吾家藏书一万卷，集录三代以来金石遗文一千卷，有琴一张，有棋一局，而常置酒一壶。”客曰：“是为五一尔，奈何？”居士曰：“以吾一翁，老于此五物之间，岂不为六一乎？”写作背景：宋仁宗庆历五年(1045年)，参知政事范仲淹等人遭谗离职，欧阳修上书替他们分辩，被贬到滁州做了两年知州。到任以后，他内心抑郁，但还能发挥“宽简而不扰”的作风，取得了某些政绩。醉翁亭记就是在这个时期写就的。目标导学二：朗读文章，通文顺字1初读文章，结合工具书梳理文章字词。2朗读文章，划分文章节奏，标出节奏划分有疑难的语句。节奏划分示例环滁/皆山也。其/西南诸峰，林壑/尤美，望之/蔚然而深秀者，琅琊也。山行/六七里
49、，渐闻/水声潺潺，而泻出于/两峰之间者，酿泉也。峰回/路转，有亭/翼然临于泉上者，醉翁亭也。作亭者/谁？山之僧/曰/智仙也。名之者/谁？太守/自谓也。太守与客来饮/于此，饮少/辄醉，而/年又最高，故/自号曰/醉翁也。醉翁之意/不在酒，在乎/山水之间也。山水之乐，得之心/而寓之酒也。节奏划分思考“山行/六七里”为什么不能划分为“山/行六七里”？明确：“山行”意指“沿着山路走”，“山行”是个状中短语，不能将其割裂。“望之/蔚然而深秀者”为什么不能划分为“望之蔚然/而深秀者”？明确：“蔚然而深秀”是两个并列的词，不宜割裂，“望之”是总起词语，故应从其后断句。【教学提示】引导学生在反复朗读的过程中划分
50、朗读节奏，在划分节奏的过程中感知文意。对于部分结构复杂的句子，教师可做适当的讲解引导。目标导学三：结合注释，翻译训练1学生结合课下注释和工具书自行疏通文义，并画出不解之处。【教学提示】节奏划分与明确文意相辅相成，若能以节奏划分引导学生明确文意最好；若学生理解有限，亦可在解读文意后把握节奏划分。2以四人小组为单位，组内互助解疑，并尝试用“直译”与“意译”两种方法译读文章。3教师选择疑难句或值得翻译的句子，请学生用两种翻译方法进行翻译。翻译示例：若夫日出而林霏开，云归而岩穴暝，晦明变化者，山间之朝暮也。野芳发而幽香，佳木秀而繁阴，风霜高洁，水落而石出者，山间之四时也。直译法：那太阳一出来，树林里的

展开阅读全文

163文库所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：第二章-描述性统计分析SPSS应用课件.ppt
链接地址：https://www.163wenku.com/p-4294220.html

晟晟文业

内容提供者

实名认证

联系作者