SPSS均数比较过程课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《SPSS均数比较过程课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 比较 过程 课件
- 资源描述:
-
1、1应用统计学SPSS统计分析方法及应用主讲:冯运义 Email:rich_2第四节 SPSS均数比较过程3一、参数检验概述o参数:描述总体的数字特征,如总体均数。o统计量:描述样本的数字特征,如样本均数。o置信度(1-):样本统计量推断总体特征的可靠性程度o置信区间:概率保证下的总体参数的可能取值范围,如本地男性平均初婚年龄有95的可能性为252周岁。nZx21 4推断统计本节中的均数比较过程是典型的参数检验,参数检验是推断统计的重要组成部分。o推断统计:由样本数据推断总体特征的方法。在对样本数据描述的基础上,以概率形式对总体的数量特征进行表述。n总体数据无法获得n搜集总体数据投入较大。o推断
2、统计包括参数估计和假设检验两种形式,二者原理一致,仅表现形式不同。51、参数估计、参数估计o定义:应用样本统计量去估计总体参数的统计推断过程。n如果在估计中直接用样本统计量作为固定的数值对参数做出估计,就是参数的点估计。如初婚年龄为25周岁。n如果在估计中要对参数做出带有某种可靠性的估计,就需要给出对应于这一可靠性或置信度的区间,即区间估计。如初婚年龄为252周岁。6区间估计与置信度o估计的区间越大,参数被包含在该区间的概率就越大,估计的可靠性即置信度也就越大。反之亦然。o观测值的离散程度即方差越小(即观测值的精度越高),相同的置信度下,其区间越短。可见区间估计总是与一定的置信度相对应的。72
3、、假设检验o假设检验的思想:首先提出假设,然后利用样本数据来检验假设,支持,则接受假设;不支持,则推翻假设。o假设检验的基本信条:小概率原理,即发生概率很小的随机事件,在一次实验中几乎不可能发生。o假设检验分为两类:参数检验:总体分布已知时(如正态分布),根据样本数据对某些总体参数(如均值)进行推断。非参数检验:总体分布未知或不符合参数检验的假定分布时。8假设检验的基本步骤o提出无效(零)假设(H0)。o选择检验统计量,给定显著性水平。o计算检验统计量的发生概率。o依据显著性水平,作出统计结论。9区间估计与假设检验的对偶性区间估计与假设检验的对偶性o在进行统计推断时,如果总体分布的形式是已知的
4、,只是参数未知,则统计推断问题就可归结为推断总体参数的问题。例如在产品质量检验中,通过随机抽取的样本不合格品率,以一定的概率把握程度估计总体不合格品率,这就是参数的区间估计问题;o如果要以一定的概率判断这整批产品是否合格,这就是一个假设检验的问题。o同一个样本-同一个统计量-同一种分布,因而两个问题可互相转换。这种互相转换形成了区间估计与假设检验的对偶性。10假设检验的几个概念o无效假设H0:关于总体参数的假设,必定包含等号H0:某值;H0:某值;H0:某值;o对立假设H1:H1:某值;H1:某值;o检验水平:即显著性水平,一般取005或001。o第类错误:当无效假设为真时,却被否定,即“弃真
5、”错误。为第类错误的概率。o第类错误:当无效假设为假时,却被接受,即“取伪”错误。为第 类错误的概率。11假设检验的两类错误o假设检验基于小概率原理:给定检验水平,如果零假设成立条件下出现现有统计量的概率等于或小于,则认为此事件可能性很小,因此就拒绝零假设。o第一类错误和第二类错误又是一对矛盾:在其他条件不变下,减少犯第一类错误的可能性,势必增加犯第二类错误的可能性。o要同时减少一、二两类错误的概率,只有增加样本量。弃真错误置信度取伪错误检验效能12双侧检验o检验样本均值与总体均值有没有显著性差异o显著性水平005o如:出生婴儿的平均体重是否为3公斤?阴影部分为拒绝域13单侧检验左单侧检验拒绝
6、域右单侧检验拒绝域显著性水平00514二、均数比较涉及的统计学原理1、正态分布:概率分布密度曲线呈钟型,两头低中间高,左右对称,近似于数学上的正态曲线。其性质和特点:n决定于均数 和方差 2。n钟形曲线n位置特征量均数、中位数、众数相等偏度和峰度均为零XuXu15标准正态分布与标准化变换o对于不同的与,范围内的概率不同,例如当=0,=1时,在(-1.96,1.96)范围内正态变量取值概率为0.95,而当=0,=1.96时,在(-1.96,1.96)范围内正态变量取值概率就不是0.95,而是0.68。o为了制一张可供不同的、共同使用的表,考虑引进标准正态分布与标准化变换o标准正态分布:是一种特殊
7、的正态分布,其均数为0,标准差为1。oZ变换:即标准化变换。若变量X服从正态分布,则Z变换后Z就服从标准正态分布。XuXuXZ16 图 标准正态曲线下从 到u范围面积示意图 172、标准正态分布与t统计量o正态分布N(,2)的资料,其样本均数服从正态分布N(,2/n),并且变换后的统计量 服从标准正态分布N(0,1)。o但在实际研究时,往往是未知的,因此只能用样本的标准差S作为的一个近似值(估计值)代替,得到变换后的统计量并记为 。o对于Z而言,正态总体确定后,就已经确定了,但是对于统计量t,则样本标准差S随样本而变。因此统计量t变异程度要大于Z,故t不再服从标准正态分布。XtSnnXZ/18
8、N=5,t统计量的峰值比标准正态分布的峰值略小,双侧尾部的值则较标准正态分布略大。N=100,接近,接近标准正态分布标准正态分布在正态总体N(168.18,62)中随机抽样,样本量分别取n=5,n=100,均抽10000个样本,分别计算t值并作相应频数图如下:193、t分布o英国统计学家W.S.Gosset(1908)给出了统计量t的分布规律,并称统计量t 服从自由度为(=n-1)的t()分布。v=1v=5v=20 t分布的图形特征和t界值 o分布特征:t分布曲线是单峰的,且关于t=0对称。ot分布与标准正态分布的关系:自由度 较小时,t分布与标准正态分布相差较大,t分布曲线的尾部面积大于标准
9、正态分布曲线的尾部面积。当自由度较大时,t分布逼近于标准正态分布。ot分布的界值:给定自由度,t分布曲线的双侧尾部面积为时对应的t值,记为 ,并称为t的双侧界值。o统计意义?vt,2/776.24,025.0t,2/t214、抽样分布o抽样分布是所有可能的样本统计量和相应的概率构成的分布,以均值和方差为数字特征。n正态分布再生定理:如果变量X 服从正态分布N(,2),则从这个总体中抽取容量为n 的样本,其样本均数也服从于正态分布N(,2/n)。n中心极限定理:对不服从正态分布的总体进行抽样,只要样本量n足够大,其样本均数也服从于正态分布N(,2/n)。225、总体参数区间估计的一般步骤o明确待
10、估参数和置信度。o用样本统计量导出总体参数的点估计值。o利用检验统计量的分布给出置信区间。23总体均数的区间估计o样本量较大时,且总体标准差已知:总体均数的95%置信区间估计o样本量较大时(如n=100),且总体标准差未知:总体均数的95%置信区间估计nxnx/96.1/96.1nSxnSx/96.1/96.124o样本量较小时,且总体标准差未知:样本均数只能进行t变换,总体均数的95%置信区间估计nStxnStx/,025.0,025.0256、均数比较的假设检验o数据类型:服从正态分布的定距型变量o拟解决:某样本均值是否来自某个已知的正态总体?两个样本所代表的总体均值是否相同?某样本所代表
展开阅读全文