心理统计学课件(ppt).ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《心理统计学课件(ppt).ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 心理 统计学 课件 ppt
- 资源描述:
-
1、心理统计学课件(ppt)(优选)心理统计学课件统计学是一种思想方法统计学是一种思想方法 从用事实说话从用事实说话 到用概率说话到用概率说话心理统计学的发展(一)统计学的基础概率论和正态分布的产生16世纪至17世纪中期。伽利略提出概率论基本理论,法国数学家帕斯卡和费马在讨论解决赌博难题中,创立了概率论,为统计学的发展奠定了重要理论基础。17世纪末18世纪。瑞士数学家贝努里提出概率论运用于社会及经济事务领域,为正态分布发现创造了条件。之后,数学家高斯等人独自发现了正态曲线方程,并首次提出正态分布曲线。19世纪初,法国数学家泊松提出“大数定理”,并导出了在概率论与数理方程中有重要应用的泊松积分。这些
2、数学家为概率论的发展做出了很大贡献心理统计学的发展(二)数理统计学的发展描述统计学与推论统计学19世纪末,英国数学家高尔顿,在生物学、优生学、心理学等研究中,努力探索简化数据的途径和方法,提出了中位数、百分位数等描述统计最为重要的概念;并与他的学生皮尔逊共同提出了相关和回归的概念。1900年,皮尔逊系统推导并阐明了配合度检验方法,将相关理论扩展到许多领域,为大样本理论奠定了基础。1908年,皮尔逊的学生格赛特有感于大样本理论的限制,开始建立小样本理论,提出t分布理论,开辟了在样本数目较小的情况下进行统计推论的新途径。1923年,经费舍数理论证,t检验得到承认并推广。然后,费舍还提出了F分布,使
3、得方差分析系统化,是推论统计的真正创始者。心理统计学的内容心理统计学的内容心理统计描述统计实验设计推论统计统计图表差异量数集中量数相关分析统计估计参数检验参数估计非参数估计点估计区间估计假设检验非参数检验样本选择与分配实验误差分析方差分析协方差分析回归分析 描述统计(descriptive statistics)主要研究如何整理心理科学实验领域调查得来的大量数据,描述一组数据的全貌。u 数据如何分组,如何使用各种统计图表描述一组数据的分布情况u 怎样计算一组数据的特征值,描述数据集中情况和分散情况的各种特征值计算与表示方法。如:平均数、中数、众数;平均差、标准差、变异系数等。u 表示一事物两种
4、或两种以上属性间相互关系的描述及各种相关系数的计算及应用条件。通过描述统计,我们使杂乱无章的数字更好地显示出事物的某些特征,有助于说明问题的实质。 推论统计(inferential statistics)主要研究如何通过局部数据所提供的信息,推论总体的情形。u 如何对假设进行检验,大样本检验方法(Z检验),小样本检验方法(t检验)等。u 总体参数估计方法,估计理论主要是根据随机抽样的结果来估计总体分布的参数值。统计检验主要根据实际的抽样结果来推论有关总体特征的假设是否与具体的随机抽样所提供的信息相一致。 实验设计(experimental design)主要目的在于研究如何科学有效地进行实验。
5、作为一个严谨的实验研究,在实验以前要对基本步骤、取样方法、条件控制、结果数据的统计分析方法等作出严格的规定。集中量数学习目标学习目标1.集中趋势各测度值的计算方法集中趋势各测度值的计算方法2.集中趋势各测度值的特点及应用场合集中趋势各测度值的特点及应用场合学习内容学习内容众数众数中位数中位数平均数平均数 众数、中位数和平均数的比较众数、中位数和平均数的比较集中趋势(central tendency)1. 一组数据向其中心值靠拢的倾向和程度2. 测度集中趋势就是寻找数据水平的代表值或中心值3. 不同类型的数据用不同的集中趋势测度值众数(mode)(1)经验公式法(皮尔逊)只能作为一个近似值 xM
6、dnM230众数(mode)众数(mode)例:众数(原始数据)无众数无众数原始数据: 10 5 9 12 6 8分类数据的众数 (次数最多的那个组) 饮料品牌饮料品牌次数次数相对次相对次数数百分数百分数(%) 可口可乐可口可乐 旭日升冰茶旭日升冰茶 百事可乐百事可乐 汇源果汁汇源果汁 露露露露1511 9 6 90.300.220.180.120.183022181218合计合计501100解:解:这里的变量为“饮料品牌”,这是个分类变量,不同类型的饮料就是变量值 所调查的50人中,购买可口可乐的人数最多,为15人,占总被调查人数的30%,因此众数为“可口可乐”这一品牌,即 Mo可口可乐可口
7、可乐顺序数据的众数回答类别回答类别甲城市甲城市次数次数 (户户)百分数百分数(%) 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意 24108 93 45 30 836311510合计合计300100.0 众数的意义与应用众数的意义与应用 (1)当需要快速而粗略地寻求一组数据的代表值时(2)当一组数据出现不同质的情况时,可用众数表示典型情况。如工资收入、学生成绩等常以次数最多者为代表值(3)当次数分布中有两极端的数目,除了一般用中数外,有时也用众数(4)当粗略估计次数分布的形态时,有时用平均数与众数之差,作为表示次数分布是否偏态的指标中位数(median)1.按大小排
8、序后处于中间位置上的值2、这个数可能是数据中的某一个,也可能根本不是原有的数。数值型数据的中位数 (奇数个数据的算例)【例例】 9个家庭的人均月收入数据原始数据原始数据: 1500 750 780 1080 850 960 2000 1250 1630排排 序序: 750 780 850 960 1080 1250 1500 1630 2000位位 置置: 1 2 3 4 5 6 7 8 9521921n位置数值型数据的中位数 (偶数个数据的算例)【例例】:10个家庭的人均月收入数据排排 序序: 660 750 780 850 960 1080 1250 1500 1630 2000位位 置置
9、: 1 2 3 4 5 6 7 8 9 10 102021080960中位数中数为居于中间位置两个数的平均数数值型数据的中位数 (重复数据的算例)【例】【例】1、3、5、6、6、8、95.5 6 6.5 Mdn=5.75【例】【例】1、3、5、6、6、6、8、95.5 6 6.5 5.83 6.17 Mdn=5.83顺序数据的中位数 (例题分析)回答类别回答类别甲城市甲城市次数次数 (户户)累计次数累计次数 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意 24108 93 45 30 24132225270300合计合计300分组数据的中位数ifFNLMdnMdnbb
10、21其中: :中数所在组的实下限 :中数所在组以下各组次数之和(以下累积次数) :中数所在组的次数 :组距bLbFMdnfi例子:*中数组的寻找方法:由下往上找,第一个大于N/2的组。解:16217267.5469.7425dnM 中数的优缺点与应用(1)当一组观测结果中出现两个极端数目时当一组观测结果中出现两极端数目时。这种情况在心理与教育科研实验中常常出现,因为心理与教育实验中的偶然因素非常复杂,有时实验中为了平衡各种误差,经常是同一种观测要在同一个被试身上反复进行多次,而只取某一个代表值作为对该被试的观测结果。这时若出现两极端的数目,又不能确定这些极端数目是否由错误观测造成,因而不能随意
11、舍去,在这种情况下,只能用中数作为该被试的代表值,这样做,并不影响进一步的统计分析。 (2)当次数分布的两端数据或个别数据不清楚时,只能取中数作为集中趋势的代表值 (3)当需要快速估计一组数据的代表值时,也常用中数 中数的优缺点与应用(2)当次数分布的两端数据或个别数据不清楚时,只能取中数作为集中趋势的代表值区当次数分布的两端数据或个别数据不清楚时,只能取中数作为集中趋势的代表值。在心理与教育实验中,经常会出现个别被试不能坚持继续进行实验这一现象,有时只知个别被试的观测结果是在分布的哪一端,但具体数值不清楚,这种情况下就只能取中数而不能计算平均数。(3)当需要快速估计一组数据的代表值时,也常用
12、中数平均数算术平均数 (arithmetic mean )nxnxxxxniin1218 .791xNx(2)分组数据的计算方法(组中值计算法)方法:把组中值看成每一分组的平均数方法:把组中值看成每一分组的平均数112211()1(47 1 52 297 6)48ciccn cnxf xNf xf xf xN 平均数的特点1、各变量值与均值的离差之和等于零0)(xxi2、所有的观测值都加上常数C,则平均值也增加常数CcxcxNi)(13、所有观测值都乘以不等于0的常数C,则平均值也增大C倍xcxcNi)(1平均数的意义算术平均数是应用最普遍的一种集中量数。它是“真值”渐近、最佳的估计值。在科研
13、实验中人们进行观测,是想知道被观测事物真正的值是多少,例如想研究人的反应时间,用计时器进行测量,人们是想测到真正的反应时间是多少。再如,使用某种测验,是想测量某个人或某些人的真实的能力水平到底有多么高。但是由于主客观各种随机因素的影响,如仪器的精密程度,测量方法,实验情景,人的观测力及观测标准等等都不能做到尽善尽美,因此想获得真值是不大可能的,人们只能用一些集中量数作为它的估计值。 平均数的优缺点算术平均数具备一个良好的集中量数应具备的一些条件:反应灵敏。观测数据中任何一个数值的或大或小的变化,甚至细微的变化,在计算平均数时,都能反应出来。确定严密。计算平均数有确定的公式,不管何人,在何种场合
14、,只要是同一组观测数据,所计算的平均数都是相同的,不凭主观确定。简明易解。平均的概念简单明白,容易理解。较少数学抽象。计算简单。计算公式只是用简单的四则运算。符合代数方法进一步演算。不但平均数的计算过程应用代数方法,而且,还可应用平均数作进一步的数学演算。例如求离均差x,以及将要讲到的求方差等等。较少受抽样变动的影响。在进行观测时,样本大小或个体的变化,对计算平均数影响很小。平均数的优缺点但是算术平均数也有一些缺点,在一定程度上限制了它的应用,这些缺点是:易受极端数据的影响。由于平均数反应灵敏,因此数据中若出现极端数据(或大或小),就要影响平均数。在心理与教育方面的实验观测中,偶然因素十分复杂
15、,经常会出现极端数目,例如,一个重点班的50名水平相当的学生,在通过一项教育测验时,绝大多数学生得分较高,但个别人却由于身体不适或一时性情绪障碍而得到很低的分数,这时若用平均数代表全班学生的知识水平,则肯定偏低,并且不符合实际情况。若出现模糊不清的数据时,无法计算平均数,因为计算平均数时需要每一个数据都加入计算。在次数分布中只要有一个数据含糊不清,都无法计算平均数。在这种情况下,一般采用中数作为该组数据的代表值,描述其集中趋势。此外,必须注意,凡不同质的数据不能计算平均数。此外,必须注意,凡不同质的数据不能计算平均数。加权平均数有些测量中所得数据,其单位权重并不相等。这时若要计算平均数,就不能
16、用算术平均数,而应该使用加权平均数。例如:高校入学考试共包括语文、政治、外语、数学、物理、化学及生物?科,而计算总分时并不是各科平等,在语文、政治等科都以100为满分的情况下,数学定120分,生物定50分,也是考虑到各门学科的相对重要性而进行加权的结果。NxNNNNxNxNxNxkkkw212211加权平均数分组数据:设一组数据为: x1 ,x2 , ,xk各组的组中值为:XC1 ,XC2 , ,XCk 相应的频数为: f1 , f2 , ,fknfXffffXfXfXxkiicikkckcc1212211按销售量分组按销售量分组组中值组中值(XC)次数次数(fi)Xc fi 14015015
17、0160160170170180180190190200200210210220220230230240145155165175185195205215225235 4 91627201710 8 4 5 5801395264047253700331520501720 9001175合计合计12022200iMiM185120222001nfMxkiii几何平均数(geometric mean)1. n 个变量值乘积的个变量值乘积的 n 次方根次方根2.适用于对比率数据的平均适用于对比率数据的平均3.主要用于计算平均增长率主要用于计算平均增长率4.计算公式为计算公式为121nnngniiMxx
18、xx112lg1lg(lglglg)niignxMxxxnn其中,其中,n:数据的个数数据的个数 X:变化的比例数据变化的比例数据在心理和教育科学研究的数据处理过程中,应用几何平均数表示集中趋势,有两种情形。1直接应用基本公式计算几何平均数。属于这种情况是:一组实验数据中有少数数据偏大或偏小,数据的分布呈偏态。这时若计算算术平均数也会出现偏大或偏小,平均数就不能很好地反映一组数据的典型情况。而用几何平均数作为集中趋势的代表,就比算术平均数优越。在心理与教育实验中,有部分数据变异较大的情况经常出现,这种场合除应用中数或众数外,时常应用几何平均数。而在心理物理学的等距与等比量表实验中,只能用几何平
19、均数。2. 应用几何平均数的变式计算。属于这种情况有:一组数据彼此间变异较大,几乎是按一定的比例关系变化。如教育经费的逐年增加数,学习、阅读的进步数,以及学生人数的增加数等等。在上述所举的几方面研究中,一般不求平均数,而是求平均增长的比率,如教育经费的平均年增长率,学校人数的年增长率,学习的平均进步率,阅读速度的平均增加率等等。这时都要用几何平均数计算平均比率,而不用算术平均数计算。 【例例】某水泥生产企业1999年的水泥产量为100万吨,2000年与1999年相比增长率为9%,2001年与2000年相比增长率为16%,2002年与2001年相比增长率为20%。求各年的年平均增长率。12310
20、9% 116% 120%114.91%ngnMxxx 【例例】一位投资者购持有一种股票,在2000、2001、2002和2003年收益率分别为4.5%、2.1%、25.5%、1.9%。计算该投资者在这四年内的平均收益率 4104.5% 102.1% 125.5% 101.9%18.0787%Mg 4.5%2.1%25.5%1.9%48.5%Mg 调和平均数(harmonic mean)主要是用以描述学习速度方面的问题。调和平均数作为集中量数之一,在描述速度方面的集中趋势时,优于其他集中量数。 在有关研究学习速度的实验设计中,一般常取两种形式:一是工作量固定,记录各被试完成相同工作所用的时间。二
21、是学习的时间一定。记录一定时间内务被试所完成的工作量。由于反应的指标不同,在计算学习速度时也不一样,这是应用调和平均数要特别注意的地方。调和平均数(harmonic mean)计算公式为)111(1121NHXXXNM其中,N:数据个数 X :具体的变量值 例:有一学生例:有一学生15分钟学会生词分钟学会生词30个,后个,后10分钟学会生词也是分钟学会生词也是30个,问该生每分个,问该生每分钟平均学会多少?钟平均学会多少?4 . 21251)3121(211HM解:由2310302153021NXX4 . 21251)3121(211HM众数、中位数和平均数的比较众数、中位数、平均数的特点和应
22、用1.众数不受极端值影响具有不惟一性数据分布偏斜程度较大时应用2.中位数不受极端值影响数据分布偏斜程度较大时应用3.平均数易受极端值影响计算方便,反应灵敏数据对称分布或接近对称分布时应用众数、中位数和平均数的关系xMdnM230032MMdnx033MxMdnx310MxMdnx作业三:作业三:1、对于下列实验数据:、对于下列实验数据:1,100,11,9,5,6,9,9,7,11,9,描述其集中趋势用,描述其集中趋势用_最为适宜,其值是最为适宜,其值是_。2、求下列次数分布的平均数、中数、众数。、求下列次数分布的平均数、中数、众数。数据离散趋势数据离散趋势离散趋势离散趋势极 差R平 均 差A
23、.D.标 准 差S.D.()变异系数V在心理统计学中,要全面描述一组数据的特征,不但要了解数据的典型情况,而且还要了解特殊情况。例如,在考察同一个年级中几个教学班的某科成绩时,通常会遇到有些班级平均成绩相同,但整齐程度不同,如果只比较平均成绩并不能真实地反应这些班级对课程学习的全貌;我们只有对班成绩分数的离散程度也进行度量,才能做到较全面的描述。因此,我们需要采用差异量数来反映数据的总体情况,除了必须求出集中量数外,还要使用差异量数。它是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量。 标志变异指标的计算标志变异指标的计算(一)极差(全距)(一)极差(全距) R Rmaxmin RX
24、-X即即: 1. 全距是总体中最大的观察值和最小观察值之差, 极差表明观察值在总体范围内变动的最大距离,极差大说明平均数的代表性小,极差小说明平均数的代表性大。2. 全距的特点 优点: 计算方便,易于理解。 缺点: 只考虑数列两端数值差异,方法粗略。 未分组或单项式:极差(R)=观察值最大值-观察值最小值组距式分组:极差(R)=末组上限-首组下限只针对闭口组 在生活中,我们常常会和极差打交道班级里个子最高的学生比个子最矮的学生高多少?家庭中年纪最大的长辈比年纪最小的孩子大多少?这些都是求极差的例子 例1.(口答)求下列各题的极差。(1)某班个子最高的学生身高为1.70米,个子最矮的学生的身高为
25、1.38米,求该班所有学生身高的极差。(2)小明家中,年纪最大的长辈的年龄是78岁,年纪最小的孩子的年龄是9岁,求小明家中所有成员年龄的极差。实际问题:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:甲:乙: 如果你是教练,你应当如何对这次射击作出评价?如果是一次选拔考核,你应该如何做选择?计算可得77乙甲x,x两人射击 的平均成绩是一样的.那么两个人的水平就没有什么差异吗?456 789 10环数频率0.10.20.3(甲)4 5 6789 100.10.20.30.4环数频率(乙)甲成绩比较分散,乙成绩相对集中看来,平均数还难以概括样本的实际状态,因此,我们还需要从另外的
展开阅读全文