现代心理及教育统计学课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《现代心理及教育统计学课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 现代 心理 教育 统计学 课件
- 资源描述:
-
1、现代心理与教育统计学注意的几个问题 1 克服畏难情绪 2 注意每种统计方法的使用条件第一章 绪论 理论统计学统计理论和方法的数理证明 应用统计学统计理论和方法的应用 数理统计的基础是概率论 概率论所研究的是随机现象。随机 概率心理与教育科学研究数据的特点 用数字形式呈现语文成绩、数学成绩、人数 随机性和变异性误差 规律性 目标是通过部分推论总体 心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。心理与教育统计学的内容心理与教育统计中的基本概念1 根据数据的观测
2、方法,可分为计数数据和测量数据 计数数据就是计算个数的数据。例如,一个班级有35名学生,一个年级有9个班级,等。测量数据,是利用一定的测量工具或测量标准所获得的数据。例如,身高180CM,体重75KG,数学成绩90分,等。2 根据测量水平,数据可分为称名数据、顺序数据、等距数据和等比数据。称名数据,又称为类别数据,此类数据只说明某一事物与其他事物在属性上的不同。例如,男人女人、一年级二年级、中国人美国人,等。顺序数据,是按照事物的某种属性,对一系列事物进行排序后所获得的数据。等距数据,是有相同单位,但是没有绝对零点的数据。例如,温度、智力分数等。此类数据只可进行加减,不能进行乘除运算。例如,数
3、学测验中,A得了80分,B得了60分,可以说A 得分高于B,A比B高了20分,但是不能说A的数学能力是B的4/3倍。比率数据,又叫做等比数据,此类数据有相同单位、也有绝对零点。例如,长度。此类数据可以进行加减运算,也可以进行乘除运算。心理和教育学中的数据绝大多数属于前三种类型。3 根据数据的连续性,分为连续数据和离散数据。连续数据,在任意两个数据点之间都可以继续细分。如,长度 而离散数据,在两个相邻数据点之间不可以细分。如人数变量、观测值和随机变量 变量,是研究所关心的一种属性,由于在获得具体数据前,其数值具有不确定性,因此称其为变量。例如,青少年的身高 一旦确定了某个具体数值,便称为这个变量
4、的一个观测值。与变量相对应的是常量,如圆周率变量与常量Y=X+C 由于变量在测查之前不能确定会获得什么样的数值,因此称其为随机变量。随机变量和非随机变量 儿童的智力水平 随机变量 Y=X+5(X=1,2,3)非随机变量总体、样本和个体 总体,指具有某种特征的一类事物的全体。构成总体的单位是个体。从总体中抽取一部分个体,称为总体的一个样本。样本中个体的数目称为样本大小或样本量(n)。样本和总体 大学生 中国大学生 武汉大学生 武汉某高校大学生 武汉某高校大二学生 武汉某高校大二某专业学生次数、比率、频率与概率 某一事件所出现的数目,称为次数,又称为频数(f)全班学生年龄为20岁的人数,即为次数。
5、两个数的比称为比率。全班20岁的10人、21岁的15人,那么比率为2/3。当分子是分母的一部分时,比率又称为比例,百分数或百分比是其中的一种特例。概率,或称为几率(P),指某一事件在总体中出现的比率,通常用比例表示。概率有的可知,有的不可知,可用有限观察得到的某事件的频率作为估计值。概率反映了某一事件发生的可能性。参数和统计量 在科学研究中,我们要探究关于所有事物总体的说明和解释。总体的特征称为参数,是描述总体情况的统计指标。样本的那些特征值叫做统计量。参数通常是通过样本特征值来预测得到的。参数常用希腊字母表示,而统计量则用英文字母表示。例如,总体平均数用表示,样本平均数用 表示。X第二章 统
6、计图表第一节 数据的初步整理 科学研究中的原始数据,大多杂乱无章,需要进行整理后才能从中提取有意义的规律性知识。统计表和统计图是对数据进行初步整理,以简化形式加以表现的两种最简单的方式。对数据进行统计分类以后,得到的各种数量结果称为统计指标。把统计指标和被说明的事物之间的关系用表格的形式表示就称为统计表。统计表具有简明、清晰、准确的特点,表中的数据易于比较分析。统计图是依据数字资料,应用点、线、画、面、体、色等描绘制成,简明而又有规律,并且能显示数量的图形,它是统计数据资料的可视化显示方式。在制作图表之前,首先要对收集到的数据资料进行初步的整理,整理的基本方法有排序和统计分组两种。数据排序 数
7、据排列就是按照某种标准,对收集到的杂乱无章的数据按照一定的顺序进行排列。例如 数学成绩:80 79 68 92 85 91 70 由低到高:68 70 79 80 85 91 92 名字:张超 梁山 陈磊 王峰 高倩 字母顺序:陈磊 高倩 梁山 王峰 张超统计分组 所谓统计分组,就是根据被研究对象的特征,将所得数据划分到各个组别中。前期准备对数据做进一步的核对和校验。(此步骤在数据排列中也应该进行)分组时要注意的问题 分组要以被研究对象的本质特性为基础。分类标志要明确,要能包括所有数据。分组的标志 分类标志按形式可分为性质类别和数量类别两种。性质类别,主要是依据事物的属性不同将被观测的事物加以
8、划分,反映事物在组别、种类上的不同,不说明事物之间的数量差异。例如,班级、年级、性别等。数量类别,以数据的取值大小为分类标志,把数据按数值大小以分组或不分组的形式排出一个顺序来。统计表 在对数据进行统计分类以后,得到的各种数量结果称为统计指标,把统计指标和被说明的事物之间的关系用表格的形式表示就成为统计表。统计表一般由表题、表号、标目、线条、数字、表注等项构成,具有简明、清晰、准确的特点,表中的数据易于进行比较分析。序号序号 要写在表的左上方,序号一般以在文章中出现的先后顺序排列。名称名称 又称标题,是一个表的名称,应写在表的上方。标题的用语要简洁扼要,使人一望可知该表的内容。如果用语过简,可
9、在下面附加说明,但这种情况不宜多用。标目标目 即分类的项目。标目的好坏决定统计表的质量,因而要认真酌定。标目一般在表的上面一行和左侧一列。如果分类的标志只有一个,写在表的左列或上行都可以。如果分类的标目有两个,且二者没有隶属关系,则左列与上行各一个。如果两个分类标志有隶属关系,则要都在一个方位(或上面或左侧)分两行分述(见表11)。数字数字 数字是统计表的语言,又称统计指标。它占据统计表的大部分空间,书写一定要整齐划一,位数要上下对齐,小数点后缺位的要补零,缺数字的项要划“”。表注表注 写于表的下面。它不是统计表的必要组成部分。如果需要可对标题补充说明。数据来源、附记等都可作为表注的内容,文字
10、可长可短。另外,关于统计表的画法应注意以下几点:表的各纵行(或称纵列)之间要用线条隔开,表的两边纵线可以省去,上下两边须有横线,标目与数字间,数字与总计间,两个总标目之间都须用线条隔开。表的上下二横线线条要粗些等等。统计图 统计图是依据收集的数据资料,应用点、线、面、画、体、色等描绘制成,简单明了、有规律,并且还能够显示数量的图形,是一种将统计数据资料可视化显示的方式。一个完整的统计图通常由图号及图题、图目、图尺、图形、图例和图注等项构成。图号及图题图号及图题 统计图的名称为图题或标题。图题的文字应简赅,只要求能扼要叙述统计图的内容,使人一见能知道该图所要显示的是何事、何物,发生于何时、何地。
11、如果图示资料比较复杂,用语简单不能明了,这时图题可用大标题与小标题。图号是图的序号,图题与图号一般写在图的下方。图题的字体是图中所用文字中最大的,但也不能过大,要与整个图形的大小相称。一般与图形标目的顺序一致,自左至右书写。图目图目 是写在图形基线图形基线上的各种不同类别、名称,或时间、空间的统计数量,即横坐标上所用的各种单位名称。在统计图的横坐标及纵坐标上都要用一定的距离表示各种单位,这些单位称为图尺,有算术单位,亦有对数单位,百分单位等等,这要根据资料的情况加以选用,图尺分点要清楚,整个图尺大小要包括所有的数据值,如果数据值大小相差悬殊,图尺可用断尺或回尺法,减少图幅。图形图形 是图的主要
12、部分,图形曲线要清晰,一般除图形线外,避免书写文字。要表示不同的结果,用不同的图形线以示区别,各种图形线的含义用图例标明,图例可选图中或图外一适当位置表示,这一切的总目的是为了使整个图和谐美观和均衡。图注图注 凡图形或其局部或某一点,需要借助文字或数字加以补充说明的,均称为图注。图注部分的文字要少,印刷字型要小,它可以帮助读者理解图形所示资料,提高统计图的使用价值,又不破坏图的美观。此外,一个图形要使用各种线条,这些线条因在图中的位置不同而有不同的名称。包括:图形基线(横坐标)、尺度线(纵坐标)、指导线、边框线等。第二节 次数分布表 次数分布显示初步整理后一组数据的分布情况。如,同一个观测值出
13、现的次数,或是每一个区间内分布的个体数目。简单次数分布表 依据每一个分数值在一列数据中出现的次数或总计数资料编制成的统计表。分组次数分布表 当数据量很大时,应该把所有的数据先划分为若干分组区间,然后将数据按其数值大小划归到相应的组别内,分别统计各个组别中包括的数据个数,再用列表形式呈现出来,就构成了分组次数分布表。步骤 1求全距。全距指最大数与最小数之间的差距。2决定组数与组距。组距是指每一组的间距,用符号i表示。组距经常用2、3、5、10、20等数值表示。组数分组数目要看数据的多少,如果数据个数在100个以上,习惯上一般分1020组,常取1216组。如果数据的总体分布为正态,可用下面的经验公
14、式计算组数(K):251.871KN分组多少与哪些因素有关?我们应该如何掌握它的标准?一般说来,分组的数目多,则组距小,计算精确。但它要求总的数据量大,否则会出现有的组距内无次数分布的现象,那将使整个数据的分布规律显示不明显,也就不能发挥次数分布表的作用了。如果分组少,组距就大,计算简单,但引进计算误差较大。因此,要做到既不增加搜集数据的工作量,又能使分组后的计算精确到最大限度,那么,按上述公式分组,是一个较好的方法。3列出分组区间。分组区间又称为分组阶段。列分组区间要注意以下几点:最高组区间内应能包含最大值的数据,最低组区间应能含最小值的数据。最高组或最低组的下限最好是组距i的整数倍。各分组
15、区间的排列顺序,一般按纵坐标单位顺序排列。为了书写方便,各分组区间只写下限的数值,然后在右侧画一横线,而且一般用整数。例如,分组区间可写为10,20,30,40等。注意注意:表述组限和实际组限的区别。组限的表述方法及实际区间范围组限的表述方法及实际区间范围 4登记次数。5计算次数(f)。各组的次数计算好后,还要计算总和即总次数。一是为了以后计算的需要,二是为了核对各组总和与数据的总数(N)是否相等。6抄录新表。登记核实后,重新制表,这个新表应有以下栏目:一栏为分组区间、二栏为组中值,各分组区间组中值的计算是精确下限加上组距i的二分之一。或精确下限与精确上限之和的一半。三栏为次数(f),四栏为相
16、对次数,可用百分次数、或频数比率(fN),这一栏有时可不用列出。这样整理的统计表就是次数分表。次数次数f组中值组中值 相对次数相对次数累积次数累积次数累积相对次数累积相对次数小于制小于制大于制大于制小于制小于制大于制大于制90-94 1920.0250 1100 285-89 2870.0449 3 98 680-84 8820.164711 94 2275-79 8770.163919 78 3870-7410720.203129 62 58 65-69 6670.122135 42 7060-64 7620.141542 30 8455-59 2570.04 844 16 8850-54
17、4520.08 648 12 9645-49 2470.04 250 4100 501.00心理与教育统计成绩分组次数分布表心理与教育统计成绩分组次数分布表 相对次数分布表 将次数分布表中各组的实际次数转化为相对次数,就可制成相对次数分布表。累加次数分布表 累加次数是把各组的次数由下而上或由上而下累加在一起。用累加次数表示的次数分布为累加次数分布。其他次数分布表 双列次数分布表 又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。所谓有联系的两列变量,指 同一组被试两次测试的结果;各方面基本相同的两组被试的测试结果。编制方法:首先按照分组次数分布表的编制方法,分别列出各变量的分组
18、区间,将一列变量的分组区间竖列,另一横列。不等距次数分布表 一般次数分布表都是等距的,实际研究中如果需要也可以列不等距的(工资级别、年龄分组等)。第三节 次数分布图 直方图,又名等距直方图,是以矩形的面积表示连续性随机变量次数分布的图形。图2-9 学生语文成绩绘制的直方图 次数多边图,是一种表示连续性随机变量次数分布的线形图。051015202505101520253035404550556065707580859095 100次数f图2-8 90名语文成绩的次数分布多边图 累加次数分布图累加直方图累加曲线图102030405060708090100人数图2-10 90名学生语文成绩累积次数分
19、布图 第四节 其他统计图表(一)条形图它是用相同宽度的条形长短或高度来比较图示指标数值大小的图形。条形图的排列,如果是横排的,称为带形图;如果是纵排的,称为柱形图。从图示现象的种类上分,有单式条形图、复式条形图和分段条形图等。以表2-8资料为例说明:年份199019911992199319941995册数212429222326263330734888表2-8 1990-1995年某中学图书馆藏书统计表图2-1 1990-1995年某中学图书馆藏书统计图(纵式柱形图)图2-2 1990-1995年某中学图书馆藏书统计图(横式带形图)复合条形图和分段条形图是把两套以上条形画在一起,用以反映有联系
20、的两种或两种以上的统计事项。一班二班三班数学平均分859078物理平均分757290表2-9 某中学初三毕业班数学、物理成绩统计表图2-3 某中学初三毕业班数学、物理成绩统计图(复合条形图)初一初二初三男生128118150女生114130100合计242248250表210 某中学各年级男女生人数统计表图24 某中学各年级男女生人数统计图(分段条形图)(二)圆形图是用圆开内扇形面积的大小来说明总体结构的图形。整个圆形面积代表所统计事项的总体,把圆的面积分成若干扇形,每一扇形面积的大小表示被研究总体的各个组成部分。上网时间所占百分比(%)1小时以内3.001-5小时27.006-10小时29.
21、0011-20小时21.0021小时以上20.00合计100表2-11 我国上网用户每周上网时间统计表图2-5 我国上网用户每周上网时间统计图(三)曲线图它是用曲线的升降来表现统计资料的数值变动的图形。常用来描绘统计事项总体指标的动态、研究对象间的依存关系以及总体各单位的分配情况等。月份123456789101112文稿数12535562070154212 588590表2-12 某公司1-12月打印文稿统计表图2-6 某公司1-12月打印文稿数量动态统计图散点图 定义:又称点图、散布图,它是用相同大小圆点的多少或疏密表示统计资料数量大小以及变化趋势的图。通常以圆点分布的形态表示两种现象间相关
22、程度。举例:身高与体重关系散点图HIGHT190180170160150WEIGHT54525048464442第三章 集中量数 集中量数是用来描述一组数据集中趋势的统计量,用来反映数据分布中大量数据向某个方向集中的程度。常用的集中量数有多种,包括算术平均数、中数、众数、加权平均数以及几何平均数等。第一节 算术平均数 算术平均数是所有观察值的总和除以总频数所得之商,简称为平均数或均数、均值。一般用字母M表示。只有在与其它几种平均数,如几何平均数、加权平均数等相区别的时候才把它叫做算术平均数。平均数计算方法如下:未分组数据计算平均数的方法:当一组数据未进行统计分组时,想描述其典型情况,找出其代表
23、值而计算其算术平均数时可用下面的公式:iXXN例1 某班选八名同学参加年级数学竞赛,成绩分别为82,90,95,88,90,94,80,93。求其平均成绩。解:把N=8,X1=82,X8=93代入公式得8989380949088959082NXX 用估计平均数计算平均数:如果数据的数目以及每个观测数据值(即数据)都很大时,应用基本公式计算比较麻烦,可以考虑应用估计平均数简化计算。即先设定一个估计平均数,用符号AM表示,从每一个数据中减去AM,使数值变小,易于计算。最后再在计算结果中加上先前的估计平均数。计算公式如下:(P56,例3-1)xXAMN对于已列成次数分布表的分组数据,其算术平均数的计
24、算公式为NfXcX 式中Xc为组中值;f为各组次数,即权数;N为总次数=f。例3 某班50人外语期末考试成绩的次数分布如下,求全班学生的平均成绩。组别组中值Xc次数ffXc90-9492327685-89871087080-848215123075-7977861670-7472536065-6967320160-6462424855-59572114503915表3-1 某班50人外语成绩次数分布表解:将表中数据代入公式,得3.78503915NfXcX 说明:利用次数分布求得的算术平均数是一个近似值。因为我们先假设组内的数据是均匀分布的,利用各组中值分别代表各组数据,这显然与实际不符,把这
25、一误差叫分组误差。算术平均数的特点 一组数据中每个观测值与平均数之差(即离均差)的总和等于0;一组数据中,如果每一个观测值都加上常数C,那么最后所得的平均数为原来的平均数加上常数C,估计平均数的公式即根据这一特点建立;一组数据中,若每一个观测值都乘以常数C,最后所得的平均数为原来的平均数乘以常数C。算术平均数的优缺点 优点优点 反应灵敏,一组数据中任何一个观测值或大或小的变化都可以通过算术平均数反映出来;严密确定,简明易懂,计算方便;适合于进一步用代数方法运算。算术平均值是计算其它很多统计特征值(如离均差、方差、标准差等)的重要基础;受抽样变动的影响较小。观测样本大小或个体的变化,对计算算术平
展开阅读全文