专题三:SPSS的统计描述1024课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《专题三:SPSS的统计描述1024课件.ppt》由用户(ziliao2023)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 专题 SPSS 统计 描述 1024 课件
- 资源描述:
-
1、SPSS的统计描述主要内容 连续变量的统计描述与参数估计概述:统计学知识回顾菜单介绍集中趋势指标离散趋势指标SPSS应用实例 分类变量的统计描述与参数估计概述常用指标分析实例多选题统计描述 统计表的制作:basic tables统计分析内容基本概念 总体(population)与样本(sample)总体:根据研究目的确定的同质观察单位(研究对象)的全体,实际上是某一变量值的集合。样本:是从总体中抽取的部分个体由于直接研究总体经常是不可能的,故而大多采用抽样研究,即通过抽取样本来推断总体统计推断参数(parameter)和统计量(statistics)参数:刻画总体特征的指标称为总体参数。用来确
2、定某一分布的特征;如总体均数,总体参数往往是未知的 统计量:刻画样本特征的指标称为统计量。由观察资料计算出来的量;可以用来近似的反映总体参数 统计的任务:由样本估计总体,由样本统计量估计总体参数选择合适的分析方法 描述性分析(descriptive statistics)数据频次、分布形态、平均数、标准差、方差 相关分析(correlation)积差相关、等级相关 差异分析(compare means)Z检验、t检验、2检验、方差分析(F检验)、回归分析、多层线性回归 结构探索与验证(factor)聚类分析、判别分析、探索性因素分析(EFA)、验证性因素分析(CFA)、结构方差模型(SEM)描
3、述统计分析 描述统计分析方法就是用特定的算式计算出数据资料的一些综合指标,用以综合说明事物或数据资料特征的一种方法。常用的描述统计的指标有平均数、标准差、相关系数等。变量 变量类型连续型变量连续型变量(定距型)-取值范围是一个区间,连续取值离散型变量离散型变量-取值范围是有限个值或一个数列构成。表示分类情况的离散型变量又称为分类变量:无序变量(名义型):两分类和多分类如血型,也可用数字进行编码,但没有大小关系。有序变量(定序型):取值为互不相容的类别,而且在研究背景下有等级顺序,如疗效(无效、有效、显效)如何描述数据的特征 可以从三个方面描述数据的特征:一是描述数据集中趋势集中量数;二是描述实
4、际观测值波动离散程度差异量数;三是知道数据的分布形态正态或偏态。平均数相同的两组数据,差异量数较小的其平均数代表的可靠性较高,而差异量数较大的一组数据其平均数代表的可靠性就较低。因此,集中量数和差异量数同时使用,才能比较全面的描述一组数据的全貌。连续变量连续变量的统计描述的工具(一)频数表Frequency直观的方法:分布类型和分布特征看出集中趋势与离散趋势发现特大与特小值便于进一步计算统计指标和做统计处理连续变量的统计描述的工具(二)统计指标1.集中趋势Central tendency 均数mean 几何均数G 中位数median 众数mode2.离散趋势Dispersion tendenc
5、y 全距Range 方差Variance 标准差std.deviation 变异系数CV连续变量的统计描述的工具3.百分位数 适用于各种分布4.分布指标Distribution 偏度系数Skewness 正态峰 正偏态 负偏态 峰度系数Kurtosis 正态峰 平阔峰 尖峭峰 其他在SPSS中出现的指标M-estimators的四个指标Outlier(三)统计表(四)统计图 直方图(Histogram)箱式图(boxplot)茎叶图(stem-and-leaf)QQ图连续变量的指标体系 集中趋势指标 离散趋势指标 分布特征:偏度峰度 其他趋势:M统计量(一)集中量数 集中量数反映了数据分布中大
6、量资料向某一点集中的情况,它是一组数据一般水平的代表值。最常用的集中量数主要有:算术平均数(arithmetic mean)中位数(median)众数(mode)几何平均数(geometric mean)1算术平均数:一组同质数据值的总和除以数据总个数所得的商。适用于对称分布,特别是正态正态分布的资料,不适用于偏态分布的资料nXnXXXXn21 算术平均数是应用最普遍的一种集中量数,通常与差异量数中的标准差和方差结合运用。易受极端值影响,且要求每一个数据都确切。iiikkkfXfffffXfXfXfXfX3213322112.中位数(median)中位数是一组观察值的位置平均数位置平均数,用于
7、描述偏态偏态分布资料的集中位置,它不受两端特大、特小值的影响,当分布末端无确切数据时也可计算。计算方法:(1)直接法:若n为奇数,则中位数为将观察值从小到大排序后中间位置那个观察值,若n为偶数,中位数为将观察值从小到大排序后中间两个观察值的算术均数。(2)加权法:用频数表计算中位数时先据频数表计算累计频数和累计频率,50百分之五十分位数即为中位数。其他集中趋势描述指标1.截尾均数(trimmed mean)数据排序后按照一定比例去掉两端的数据求均数 适用于两端有极端值的资料 常用5截尾均数2.几何均数(geometric mean,G)适用于呈倍数关系的等比资料或对数正态分布的资料,尤其是对数
8、正态分布的计量资料 应用中应注意观察值不能同时有正有负 同一资料算得的几何均数小于算术均数。2.几何平均数:是指n个数值连成的n次方根,用mG表示。nnGxxxm21 X表示整个发展时期中每个发展阶段的发展速度。几何平均数一般用于表示计算某现象或事物的平均发展速度、平均增长速率等。nnnnnnnGaaaaaaaaaaxxxxm012312013213.众数(mode)样本数据中出现频次最高的数字 适用于单峰对称的数据,反映出现频次最高的数据情况4.调和均数(Harmonic Mean)观察值倒数的均数的倒数,较少使用(二)离散趋势指标 对连续变量的描述,需要将集中趋势和离散趋势结合起来,才能对
9、其分布有全面的认识。差异量数是表示一组资料差异情况或离散程度的量数,它反映资料分布的离中趋势。描述离散趋势的指标常用的有:极差(Range)(全距)百分位数与四分位数间距 (Percentile and Quartile range)方差(Variance,S2)标准差(Standard Deviation,SD)变异系数(差异系数,Coefficient of Variation,CV)1.全距(Range,R)又称极差,即最大和最小观察值之间的间距,用全距描述资料的离散程度简单明了,但它不能反映观察值的整个变异度,样本的个数越多,极差越大,不够稳定。所以在样本含量相差悬殊时不宜使用2.方差
10、 方差(variance)也称均方差(mean square deviation),样本观察值的离均差平方和的均值。表示一组数据的平均离散情况。22()XN 总体方差11)(2222nnXXnXXS样本方差小样本分母为n-1,称为自由度。因为有两个定义,用在不同的场合:如是总体,标准差公式根号内除以n,如是样本,标准差公式根号内除以(n-1),因为我们大量接触的是样本,所以普遍使用根号内除以(n-1),3.标准差(Std)标准差是方差开方后的结果(即方差的算术平方根);所谓标准差,即指一组资料中每个数值与该组数据平均数离差的平方和之平均数的平方根。其单位与原变量X的单位相同。nxxi2)(例1
11、:下面是一个班两个学习小组在一次测验中的成绩;甲组10名学生:80、85、90、95、100;乙组10名学生:88、92、90、94、86.请初步分析这两个小组的成绩。nxxi2)(两组平均成绩:90 甲组标准差:乙组标准差:9.725516.310 适用范围:方差和标准差适合于对称分布,特别是正态分布方差和标准差适合于对称分布,特别是正态分布及近似正态分布资料及近似正态分布资料。标准差可用于描述变量值的离散程度,与均数结合还可描述资料的分布情况,此外还可用于求参考值范围和计算标准误。标准差是表示个体间变异大小的指标,反映了整个样本对样本平均数的离散程度,是数据精密度数据精密度的衡量指标。而标
12、准误反映样本平均数对总体平均数的变异程度,从而反映抽样误差的大小,是量度结果精密度结果精密度的指标。4.百分位数(percentile)百分位数是一个位置指标,Px表示 是资料分布数列的百等份分割值 用于描述样本或总体观察值序列某百分位置的水平,应用中注意,样本例数不够多时,两端的百分位数不稳定 还用于确定参考值范围(reference range)5.四分位数间距(quartile interval)四分位数是特定的百分位数,其中P25为下为下四分位数四分位数QL,P75为上四分位数为上四分位数Qu。Q=Qu-QL 四分位数间距比极差稳定,但仍未考虑每个观察值的变异度。适用于偏态分布偏态分布
展开阅读全文