体育统计方法与实例第三章-统计描述课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《体育统计方法与实例第三章-统计描述课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 体育 统计 方法 实例 第三 描述 课件 下载 _体育_小学
- 资源描述:
-
1、体育统计方法与体育统计方法与实例实例第三章第三章 统计描述统计描述统计描述统计描述描述统计描述统计频数分析频数分析统计图表统计图表第一节第一节 描述统计描述统计学习学习目标:目标1 掌握集中量数的统计意义及计算方法目标2 掌握差异量数的统计意义及计算方法目标3 掌握变异系数的统计意义及计算方法 在分析或研究体育现象时,常常以样本特征数(描述样本信息特征的数值)去估计总体参数,样本特征数的指标主要有集中量数指标和离散量数指标两种。第一节第一节 描述统计描述统计描述统计量包括:描述统计量包括:n1 集中量数指标n2 离散量数指标n3 分布参数n4 描述统计的SPSS例解第一节第一节 描述统计描述统
2、计1 1 集集中中量量数数指指标标 反映一群性质相同的观察值的平均水平或集中趋势的统计指标即为集中量数。常用的有:算术平均数、中位数、众数、百分位数等,下面针对这几种集中量数的涵义及小样本的计算方法进行举例说明,大样本的计算方法见后面的SPSS软件的介绍。第一节第一节 描述统计描述统计一、集中量数指标包括:一、集中量数指标包括:1 算术平均数(Average)2 中位数(Median)3 众数(Mode)4 百分位数(Percentile)一、集中量数指标一、集中量数指标1.1.算术平均数(算术平均数(AverageAverage)(1 1)定义:)定义:所有同质数据的总和除以数据的个数所得的
3、商,即为该组数据的算术平均数,简称平均数、均数或均值。就是说,如果有一组数据 (I=1,2,3n),把(3-1-1)称为本组数据的算术平均数。其中为数据的总和;(读作Xbar)为算术平均数;为某个体变量。nxxnxxnii也可简化为1nixxxx21xixix(2 2)平均数的直接计算方法)平均数的直接计算方法例3-1-1 若有5人的跳高成绩(单位:米)为:1.60 1.62 1.68 1.65 1.64,求其跳高成绩的算术平均数。解:5人跳高成绩的算术平均数为:一般情况下,计算的最后结果要比原始数据多保留1位小数,下同。)(638.1564.165.168.162.160.1米nxx(3 3
4、)平均数的加权计算方法)平均数的加权计算方法 数据分组后,可以利用加权法计算算术平均数。加权法可以根据频数分布表中数据的频数计算均数,也可以根据事先设置的权重计算均数。权重就是各个数据的重要程度的系数(所有数据的权重之和等于1)。加权法计算均数多用于学生体质或者体育综合成绩的计算、教学评估的合成分数以及多组数据平均数的合成。加权法计算算术平均数的公式为:(3-1-2)kiikiiikknffxffffxfxfxx11212211 例例3 3-1 1-22 某年级有四个班学生的体育成绩,1班有35人,平均分为75分;2班有32人,平均分为78分;3班有36人,平均分为81分;4班有30人,平均分
5、为79分,求4个班体育成绩的总平均分。)(3.7830363235307936813278357511分解:kiikiiiffxx 例例3 3-1 1-33 某教师在学期末的100名学生学评教中,教学基本功、教学内容、教学方法以及教学创新的得分分别为95分、89分、92分、85分,学校规定教学基本功、教学内容、教学方法以及教学创新的得分权重分别是30%、40%、20%、10%,试计算该教师学期末的学评教(总)平均得分。)(911.0852.0924.0893.095分解:x 例例3-1-43-1-4 某班20名男生的引体向上成绩如表3-1-1所示,求平均数。表3-1-1 20名男生的引体向上成
6、绩)(72014012345321202153104855312011个解:kiikiiiffxx 例例3-1-53-1-5 有一组跳远数据的频数分布资料,如表3-1-2所示,计算平均数。表3-1-2 100名学生跳远成绩的频数分布)(7.3441003447211cmffxxkiikiii解:平均数的优缺点:平均数的优缺点:优点优点:均数计算简便,适合代数运算,是一个用途最广效果也很好的统计量。既考虑到频次的多少又考虑到变量值的大小,它可靠、灵敏,也是对资料所提供信息运用最充分。缺点缺点:均数易受少数极端数据的影响而大大改变其数值,故严重偏态的分布,用均数往往不能较好地反映资料的集中趋势。平
7、均数的意义平均数的意义:(1)平均数是反映同质对象观察值的平均水平或集中趋势的统计量。适用于定距以上测度的变量。(2)对于多组数据,在同质、同单位的情况下,利用平均数可以比较多组数据的平均水平。2.2.中位数(中位数(MedianMedian)将样本的观察值按其数值大小顺序排列起来处于中间位置的那个数即为中位数。它处于频数分配的中点,不受极端数值的影响。中位数用“”表示。eM中位数的计算公式:中位数的计算公式:当为n奇数时,则位于中间位置第(n+1)/2位置的那个数即中位数:(3-1-3)当为n偶数时,则位于中间两项,第与第位置的两数的平均数即中位数:(3-1-4)21neXM2n12n2)(
8、122nneXXM计算步骤:计算步骤:将数据按照从小到大的顺序排列起来求项数:Om=(n+1)/2 求中位数eM例例3-1-6若由8名运动员的纵跳成绩(单位:米)为:10.20 10.35 10.84 10.6810.92 11.05 11.21 11.38,试求中位数。将数据按照从小到大的顺序排列起来10.20 10.35 10.68 10.84 10.92 11.05 11.21 11.38求项数:Om=(n+1)/2=(8+1)/2=4.5即中位数位于第四和第五项之间求中位数:Me=(10.84+10.92)/2=10.88中中位位数数的的优优点点:当数据严重偏态,有个别极端值特别大或特
9、别小时,不会影响中位数的大小.因而在当数据严重偏态,平均数失去应有的代表性时,用中位数来反映数据的集中趋势更合适.适合于定序以上的变量.3.3.众数(众数(ModeMode)定义:定义:数据中出现次数最多的数据为本组数据的众数,它能明确反映数据分布的集中趋势。众数是一种位置平均数,不受极端数据的影响。但并非所有的数据组都有众数,一组数可能存在一个众数,也可能存在多个众数,众数用“”表示。众数的计算方法:众数的计算方法:对于小样本数据,直接数出数据的个数,个数最多的数据为本组数据的众数。如果样本量较大,在频数分布表中频数分布最多的那一组的组中值即为本组数据的众数。oM 例例3-1-73-1-7已
10、知100名某年龄组跳远成绩的频数分布表如下,试求本组数据的众数。表3-1-3 100名某年龄组跳远成绩(单位:厘米)的频数分布表 在表3-1-3中,频数最多的是第5组,频数为25,该组的组中值为(330+346)/2=338,故本组数据的众数为338.注意:注意:中位数、众数受极端数据(数值非常大或非常小)的影响较小。算术平均数、中位数、众数间的关系算术平均数、中位数、众数间的关系:当频数分布呈完全对称分布时,算术平均数、中位数、众数三者相同,如图3-1-1所示。图3-1-1 对称分布 当频数分布呈正偏态时,算术平均数大于中位数、众数小于中位数,如图3-1-2所示。图3-1-2 正偏态分布 当
11、频数分布呈负偏态时,算术平均数小于中位数、众数大于中位数,如图3-1-3所示。图3-1-3 负偏态分布 平均数、中位数和众数都是描述数据集中趋势的统计量,它们分别适用于不同分布的数据资料。平均数适用于无异常值的正态或近似正态分布的数据资料;中位数适用于存在异常值且严重偏态的数据资料;众数适用于分布不匀,而个别数据重复次数较多的数据资料。4.4.百分位数(百分位数(PercentilePercentile)定义:定义:百分位数是将数据按由小到大的顺序排列起来后,用99个点将数据100等分,处于各分点位置上的数,称为百分位数,用Pk(或xi)表示。其中,k=1,2,99表示百分位数的位置或分点或分
12、点所对应的分数。Pk表示有k%的数据小于等于Pk,有(100-k)%的数据大于等于Pk。P50 就是中位数Me。分点的位置记为i。百分位数的计算过程与中位数类似,具体步骤如下:百分位数的计算过程与中位数类似,具体步骤如下:(1)将数据从小到大排列后为(2)确定所求百分位数的位置i。设求第k百分位数,则位置为:(3-1-5)(3)确定百分位数Pk。若计算i为整数,则直接在排好的数据中找到第i个数据即所求。若计算i为小数,则取i两侧的数据中求算术平均数即所求。1100nkinxxx,21 例例3-1-83-1-8测得30名男生的助跑摸高的数据(单位:cm)如下:求第25、50、75百分位数。解:1
13、)将30个数据从小到大排列后如下:2)确定所求百分位数的位置i。设求第25百分位数,则位置为:结果不为整数,说明第25百分位数的位置在第7位与第8位观测值的中间。75.71002531100)1(25kni3)确定百分位数。取第7位和第8位观测值的算术平均数作为第25百分位数,即 288是第25百分位数,说明有25%的摸高数据比它小。也可理解为该群体有100个摸高数据,则会有25个数据比288小。同理可得,第50百分位数是301.5,第75百分位数是311。这三个等分点把原始数据四等分,称为第一四分位数、第二四分位数、第三四分位数,分别记为Q1、Q2、Q3,它们统称为四分位数,记为Q。百分位数
14、适用于定序以上的数据。)(288228928775.725cmxP 任何一组数据,尽管它们属同质的数据,但在量上又是由具有差异的个体组成的,这些数据既是同质的又是有差异的,有时用集中位置量数难以反映一组数据的全貌,这是由于一组数据除了集中水平的一面,还有离散程度的一面。例如:两组运动员引体向上的成绩如下:甲组:3,5,5,5,5,6,6。=5乙组:1,2,4,5,6,9,8。=5甲x乙x二、二、离散量数指标离散量数指标 以上两组成绩的平均数皆为5次,但其组内观察值的分布情况却不相同,乙组离散程度要大于甲组,因此,要全面反映变量的特征,除了考察变量的平均水平外,还必须要反映离散程度。离散量数是反
15、映一群性质相同的观察值的离散程度的统计指标。常见的有:极差、四分差、方差、标准差、变异系数。1.1.极差极差(全距全距)(Range)(Range)极差是一组数据的最大值和最小值的差,用字母R表示。即:(3-1-6)R越大表示数据的离散程度越大,反之则越小。使用极差描述数据的离散程度公式简介,但是公式中只是涉及到了最大值和最小值两个数据,而中间的大部分数据信息未在极差中体现,信息不全,故容易受到极值的影响。如果存在极端数据,不宜采用R来描述数据的离散程度。极差适用于定量数据。minmaxxxR二、二、离散量数指标离散量数指标 例例3-1-93-1-9 采用例3-1-6的数据,8名运动员的纵跳成
16、绩(单位:米)为:10.20 10.35 10.84 10.6810.92 11.05 11.21 11.38,试求极差。解:)(18.120.1038.11minmax米xxR2.2.四分差四分差(Quartile Deviation)(Quartile Deviation)四分差(四分位差)是一组数据中第三四分位数与第一四分位数之差的一半。记 为计算公式为:(3-1-7)四分差的意义是除去两端各四分之一的部分,用剩余中间的一半来测定四分之一的距离大小。它去掉了极端数据,不受极端值的影响,在反映数据的离散程度方面较之极差略准确一些。它适用于定量数据。Q2QQQ13 例例3-1-103-1-1
17、0 采用例3-1-8的数据,测得30名男生助跑摸高的数据(单位:cm)如下:求四分差。解:由例3-1-8的计算结果可知Q3=P75=311 Q1=P25=288,因此)(5.1122883112QQQ13cm3.标准差标准差(Standard Deviation)与方差与方差(Variance)标准差是所有变量值与其均数的离差平方的算术平均数的平方根。方差是所有变量值与其均数的离差平方的算术平均数。方差常用在统计推断中,方差的单位时原始变量值单位的平方,不太符合习惯。两者都适用于定量数据。对于原始数据来讲,若一个总体中有N个观察值,则总体标准差的计算公式为:(3-1-8),21NxxxNx2)
18、(总体方差的计算公式为:(3-1-9)其中,2为方差,为总体均数,N为总体中的个体数目。如果一个样本包涵了n个观察值 则样本标准差S的计算公式为:(3-1-10)Nx 22nxxS2,21nxxx 根据数理统计的研究,用样本资料获得的标准差差,往往比总体标准差偏小,为了得到总体标准差较好的估计值,可将分母中的 n减去1,即(3-1-11)其中,S样本标准差,n-1为自由度(能够进行独立变化的变量个数),记为。方差的计算公式为(3-1-12)12nxxS122nxxSn 例例3-1-113-1-11 求2,4,6的标准差和方差。解:=2 43642nxx 12 nxxS 13464442222
19、413)46()44()42(122222nxxS 也可利用下面的公式,省去计算平均数,如果平均数不是整数的话,根据四舍五入的均值计算的标准差不是很准确。(3-1-13)122nnxxS小样本标准差的直接求法(不计算均值)步骤如下:小样本标准差的直接求法(不计算均值)步骤如下:列标准差的计算表,求出变量的和X和变量的平方和X2根据标准差的计算公式求S,其计算式为 1/22nnxxS 例例3-1-123-1-12 10名学生的引体向上的数据(单位:次)为:7、3、9、6、10、12、5、11、4、13,试求其标准差。解:列标准差的计算表,求出变量的和X和变量的平方和X2表3-1-4 标准差的计算
20、表根据标准差的计算公式求根据标准差的计算公式求S S,其计算式为,其计算式为)(5.311010/807501/222次nnxxS标准差的意义:标准差的意义:标准差是描述数据离散程度的统计量;对于多组数据,在同质、同单位、均数相等或近似相等的情况下,可以比较多组数据的离散程度(三个条件缺一不可);标准差越小,说明观察值的离散程度越小,标准差越大,说明观察值的离散程度越大。经计算:=40.23m,=40.23m;=0.945m,=2.07m 两个队员的标枪成绩的平均数都是40.23m,但是观察甲队员的最好成绩为42.10m,最差成绩为38.70m,而乙队员的最好成绩为43.32m,最差成绩为29
21、.50m,甲队员的成绩相对乙队员的成绩较整齐,并且计算得知S甲=0.945m S乙=2.07m,说明甲队员的成绩比乙队员稳定。甲X乙X甲S乙S4.4.变变异异系系数数(C Co oe ef ff fi ic ci ie en nt t o of f V Va ar ri ia at ti io on n)变异系数是反映变量离散程度的统计指标,是以样本标准差除以平均数的商的百分比来表示的,表达式为:CV=CV=(3-1-14)变异系数CV是相对数,无单位。CV的值越小,运动员成绩越稳定;反之,越不稳定。%100 xS引入变异系数的原因:引入变异系数的原因:在比较多组数据的离散程度时,对于性质不同
22、或单位不同或平均数不相等的数据,就不能利用标准差比较了;变异系数是描述数据离散程度的统计量,在比较多组数据的离散程度时,利用变异系数比较不受上述三个条件的限制。例例3-1-133-1-13有一位男运动员,其主项是100米,兼项是跳远。在竞赛期内,其主、兼项的20次测试结果是:100米:=12秒,S1=0.15秒;跳远成绩:=5.9米,S2=0.18米,试比较该运动员的主、兼项成绩的稳定性。解:CV100=CV跳远=因为CV1000,则分布右侧有长尾,称正偏态,如图3-1-4;若SK1或SK-1;中度偏态:0.5SK1或-1SK0 图3-1-5 负偏态分布SK0,则为尖峰分布;若Ku0,则为平峰
23、分布。三、三、分布参数分布参数图3-1-6 峰度系数与分布形态 例例3-1-15 3-1-15 采用例3-1-1424名男生1500米跑的分数的数据,试求偏度系数SK.解:求原始数据的平均数和标准差得:平均值为:64.5分,标准差为12.3分,则 在体育实践中,往往是大样本数据,利用公式计算非常繁琐,容易出错,SPSS软件解决了这个问题,下面结合实例介绍统计描述量的计算过程。例例3-1-16 3-1-16 某年龄段104名男生助跑摸高的成绩如下(单位:cm),请运用SPSS软件计算其平均数、中位数、众数、标准差、方差、极差、最大值、最小值、四分位数、偏度系数和峰度系数、第10、30、90百分位
24、数。四、四、描述统计的描述统计的SPSSSPSS例解例解用用SPSSSPSS软件进行描述统计的步骤如下:软件进行描述统计的步骤如下:选择“分析(A)”菜单“描述统计”“频率(F)”命令,弹出如图3-1-7所示的对话框。双击“助跑摸高”,将其选入变量(V)复选框,然后单击“统计量(S)”按钮。弹出如图3-1-8所示的对话框。单击均值、中位数、众数、标准差、方差、范围、最大值、最小值、偏度、峰度、四分位数、然后单击“百分位数”,在其后的空格里分别输入10、30、90后,依次单击下面的“添加”按钮,然后单击“继续”按钮,返回上一级菜单。单击“确定”按钮,完成计算。其结果如表3-1-4所示。图3-1-
25、7“频率(F)”对话框图3-1-8“频率:统计量”对话框表3-1-4统计量 本例的输出结果:表3-1-4是描述统计结果,显示样本量N=104;缺失值=0;104名男生助跑摸高的均值=296.53,中位数=301.00,众数=306,标准差=17.005,方差=289.164,偏度系数=-0.855,峰度系数=0.051,极差(全距)=69,最小值=253,最大值=322,第一四分位(25%)=287.25,第二四分位(50%)=301.00(即中位数),第三四分位(75%)=307.75,第10百分位数=266.00,第30百分位数=292.00,第90百分位数=315.00。练习题练习题3.
展开阅读全文