体育统计学课件1-8章1214课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《体育统计学课件1-8章1214课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 体育 统计学 课件 1214
- 资源描述:
-
1、 统计的作用统计的作用客观事物的特征客观事物的特征研究 运动性特征:反映运动能力心理能力等方面的数量指标是具有 运动性特征的。(1,与运动有关;2,是动态的)综合性特征:兼有自然科学和社会科学的综合属性。客观性特征:数据来源于客观事物本身,是对客观事物的反映。1,总体的概念:根据统计研究的具体研究目的而确定的同质对象的全体。2,个体的概念:组成总体的每个基本单位。3,总体的分类:有限总体:基本研究单位的边界是明晰的,并且基本研究单位的数量是有限的总体。无限总体:基本研究单位的数量是无限多个的总体。1,样本的概念:根据研究需要与可能,从总体中抽取的部 分研究对象所形成的子集为样本。2,样本的分类
2、:随机样本和非随机样本至少理论上至少理论上可以穷举可以穷举不能穷举nmAP)(nmAPnmAfnmAf)()(n)(,当 在高等数学中,采用连加求和缩写式形式来表示连加求和数,它的一般形式为:其中:连加求和号 变量(一组观测数据)在 中,i 是下标,n 是上标,i、n 表示连加求和的界限,即从通项公式具体分解的第一项开始相加一直到第n项为止。各具体项根据 i 的取值不同而有所不同,i 取1为第一项,取“n”为第n项。niix1ixniix1nniixxxx211体育中常用的连加求和运算:22121nniixxxxninixxxx1222212nniniiyxyxyxyx22111 为了避免符号
3、过于复杂,今后凡在求和范围可以看清的为了避免符号过于复杂,今后凡在求和范围可以看清的条件下,通常将条件下,通常将号上下标省略不写,简记为号上下标省略不写,简记为ix?iidf?2 xxi?iiyx?)()()(22yyxxyyxxiiii第二章第二章 统计资料的收集与整理统计资料的收集与整理 收集资料的基本要求收集资料的基本要求 1:资料的准确性 2:资料的齐同性 3:资料的随机性 收集资料的基本方法收集资料的基本方法 1:日常积累 2:全面普查 3:专题研究 简单随机抽样(完全随机抽样)简单随机抽样(完全随机抽样)抽取特点:1:不分组,不分类,不排队地抽取;2:总体中每个个体都有被抽中的机会
4、;3:总体中每个个体被抽中的机会是均等的。抽取方法:1:抽签法 2:随机数表法(见随机数表)该方法的优点:样本代表性好该方法的缺点:总体含量大时,编号困难。工作量大。抽取步骤方法:1:按属性特征分成若干类型、部分或层;2:在类型、部分或层中按照比例进行简单随机抽样。分层的需注意的问题:1:层间必须有清晰的界面;(类间差异大,类内差异小)2:必须知道各类型中的个体数目和比例;3:层的数目不宜太多,但也不要极少。分层抽样的优点:1:能够提高样本代表性,又不至于给调查工作带来麻烦,在代表性和工作量之间做出了平衡;2:适用于总体情况复杂、个体数目较多的情况。某大学体育系大一新生总体人数合计900人田径
5、350人篮球200人足球150人网球100人体操80人游泳20人分层田径35人篮球20人足球15人网球10人体操8人游泳2人按照10%比例简单随机抽样研究样本含量为90人按照学生专按照学生专项属性分层项属性分层 整群抽样的特点:区别于简单随机抽样和分层抽样,抽样的单位不再是总体中的个体,是总体中的划分出来的群。划分群应注意的问题:群间差异要小,群内差异要大。讨论:调查广东省初中毕业生体质达标的情况。如何抽样?资料的审核资料的审核1:初审简单排误2:逻辑检查专业知识、常识,指标关系间排误3:复核按比例抽样复核 频数整理频数整理频数分布表的制作频数分布表的制作频数分布表的编制(实例)分组方法单变量
6、值分组单变量值分组 1.将一个变量值作为一组 2.适合于离散变量 3.适合于变量值较少的情况单变量值分组表单变量值分组表表表 某小学五年级学生跳绳成绩表某小学五年级学生跳绳成绩表成绩成绩(个个)频数频数(人人)成绩成绩(个个)频数频数(人人)成绩成绩(个个)频数频数(人人)107108110112113114115117118121211133119120121122123124125126127121443223128129130131133134135137139211122112组距分组组距分组将变量值的一个区间作为一组适合于连续变量适合于变量值较多的情况必须遵循“不重不漏”的原则可采用
7、等距分组,也可采用不等距分组组距分组的步骤(等距分组)组距分组的步骤(等距分组)求全距(极差)求全距(极差)R R:确定组数:组数的确定应以能够显示数据确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,的分布特征和规律为目的。在实际分组时,可以按可以按 Sturges Sturges 提出的经验公式来确定组提出的经验公式来确定组数数K K2lglg1nK组距分组涉及的几个概念组距分组涉及的几个概念 1.下下 限:限:一个组的最小值一个组的最小值 2.上上 限:限:一个组的最大值一个组的最大值 3.组组 距:距:上限与下限之差上限与下限之差 4.组中值:组中值:下限与上限
8、之间的中点值下限与上限之间的中点值1.求全距(极差)求全距(极差)R:确定组数确定组数:3.确定组距:确定组距:)2lg()50lg(1K1+1.70/0.306.66774.确定组限:确定组限:5.1 1:可以依据已有的成熟的:可以依据已有的成熟的专业经验来确定;专业经验来确定;2 2:可参考前苏联专家制定:可参考前苏联专家制定的参考表(如右表)确定:的参考表(如右表)确定:可以绘制直观的图形来方可以绘制直观的图形来方便了解数据的信息。便了解数据的信息。较常使用的图形形式有多较常使用的图形形式有多边形图和直方图等。边形图和直方图等。图形中,一般图形中,一般横坐标横坐标代表代表组限组限,纵坐标
9、纵坐标代表代表频数频数。样本含量(n)分组数(k)30-605-860-1007-10100-2009-12200-50011-15作业作业数据特征及其测量指标数据特征及其测量指标分布状况分布状况集中趋势集中趋势离散程度离散程度 中位数,又称中数,中点数。中位数,又称中数,中点数。符号符号Md(Median)Md(Median),定义:是指位于一组数据中较大一半与定义:是指位于一组数据中较大一半与较小一半中间位置的那个数。较小一半中间位置的那个数。Md 特征:此数可能是数据中的某一个,也可能根本特征:此数可能是数据中的某一个,也可能根本不是原有的数据。不受极端值的影响不是原有的数据。不受极端值
10、的影响 计算方法:将数据依大小次序排列,若数据个数计算方法:将数据依大小次序排列,若数据个数为奇数,则取数列中间的那个数为中数;若数据为奇数,则取数列中间的那个数为中数;若数据个数为偶数,则取中间两个数的平均数为中数。个数为偶数,则取中间两个数的平均数为中数。为偶数时当为奇数时当NXXNXMdNNN1222121 概念:样本观测值在频数分布表中频数最多的那一概念:样本观测值在频数分布表中频数最多的那一组的组中值。组的组中值。(分组数据的众数,属于引申概念)分组数据的众数,属于引申概念)原始概念:众数,符号原始概念:众数,符号MoMo,它指在一组数中出现次,它指在一组数中出现次数最多的那个数。计
11、算方法是直接找到出现次数最数最多的那个数。计算方法是直接找到出现次数最多的那个数。多的那个数。众数具有不唯一性。例如:众数具有不唯一性。例如:频数最多的那一组的组中值。频数最多的那一组的组中值。如书如书P21-P22:P21-P22:练习:找找众数,利用上次所做的作业。练习:找找众数,利用上次所做的作业。几何平均数几何平均数 概念:样本观测值的连乘积,并以样本观测概念:样本观测值的连乘积,并以样本观测值的总数作为次数,开方所得的数据。值的总数作为次数,开方所得的数据。主要适用于一组数据中有少量数据偏大或偏主要适用于一组数据中有少量数据偏大或偏小,数据分布呈偏态。小,数据分布呈偏态。计算公式:计
12、算公式:举例说明:举例说明:1 1,2 2,3 3,4 4,8 8,1616,4242,108108 见教材见教材P22,P22,例题例题3.43.4算术平均数算术平均数 算术平均数简称为平均数或均值,符号为算术平均数简称为平均数或均值,符号为M M(MeanMean)总体算术平均数:希腊字母总体算术平均数:希腊字母 (音:音:miu)miu)样本算术平均数:英文字母样本算术平均数:英文字母 (音:音:X bar)X bar)。算术平均数是由所有数据之和除以数据个数所得的算术平均数是由所有数据之和除以数据个数所得的商数,用公式表示为:商数,用公式表示为:xNXNXXXXNiiN121 算术平均
13、数在应用上有如下特点算术平均数在应用上有如下特点:算术平均数是一个良好的集中量数,具有反应灵敏、确定严密、简明易解、计算简单、适合进一步演算和较小受抽样变化的影响等优点。算术平均数易受极端数据的影响,这是因为平均数反应灵敏,每个数据的或大或小的变化都会影响到最终结果。概念:一组数据最大值与最小值之差。公式:特征与缺陷:1:能够了解数据的范围(区域,区间)。2:只考虑极值,容易受到异常数据的影响,属于粗略的指标值,精细程度不够。绝对差:平均差;n1iixx绝对差nxxn1ii平均差1 1:是离散程度的测量指标值之一,最常用。:是离散程度的测量指标值之一,最常用。2 2:能反映数据的分布。:能反映
14、数据的分布。3 3:能反映各变量值与均值的平均差异。:能反映各变量值与均值的平均差异。4 4:根据总体数据计算的,称为总体方差或标:根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差准差;根据样本数据计算的,称为样本方差或标准差。或标准差。NXXNii122)(NXXNii12)(1)(1221nxxSniin1)(121nxxSniin一组数据中可以自由取值的数据的个数一组数据中可以自由取值的数据的个数当样本数据的个数为当样本数据的个数为 n 时,若样本均值时,若样本均值 x 确定后,确定后,只有只有n-1个数据可以自由取值,其中必有一个数据则个数据可以自由取值,其中
15、必有一个数据则不能自由取值不能自由取值例如,样本有例如,样本有3个数值,即个数值,即x1=2,x2=4,x3=9,则,则 x=5。当。当 x=5 确定后,确定后,x1,x2和和x3有两个数据可以有两个数据可以自由取值,另一个则不能自由取值,比如自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么,那么x3则必然取则必然取2,而不能取其他值,而不能取其他值样本方差用自由度去除,其原因可从多方面来解释,样本方差用自由度去除,其原因可从多方面来解释,从实际应用角度看,在抽样估计中,当用样本方差从实际应用角度看,在抽样估计中,当用样本方差去估计总体方差去估计总体方差2时,它是时,它是2的无偏估
16、计量的无偏估计量 平均数与标准差在决策中的直接应用。平均数与标准差在决策中的直接应用。变异系数在稳定性研究中的应用。变异系数在稳定性研究中的应用。法在原始数据逻辑审核中的应用。法在原始数据逻辑审核中的应用。Sx3 用用 队员甲:队员甲:40.50;41.26;40.44;39.62;40.12 42.10;39.84;40.18;38.70;39.54 队员乙:队员乙:40.48;42.88;40.50;39.50;38.00;43.32;38.72;41.82;36.84;40.24简单应用平局数与标准差进行数据决策的步骤:简单应用平局数与标准差进行数据决策的步骤:1:确定样本数据的全域。:
17、确定样本数据的全域。2:确定样本数据的平均水平。:确定样本数据的平均水平。3:确定样本数据的离散程度。:确定样本数据的离散程度。4:根据专业专项应用要求采取相应不同决策。:根据专业专项应用要求采取相应不同决策。注意:决策前提是认同所取得的数据是真实客观有效的。注意:决策前提是认同所取得的数据是真实客观有效的。121x9.52x15.0S18.0S%25.1%1001215.0%10011100 xSCVm%05.3%1009.518.0%10022xSCV跳远Sx3 5.158x法在原始数据逻辑审核中的应法在原始数据逻辑审核中的应用用1.4S1751x8.1442x1563xSx3Sx3Sx3
18、作业作业100100个样本数据的频率分布直方图个样本数据的频率分布直方图200200个样本数据的频率分布直方图个样本数据的频率分布直方图总体密度曲线总体密度曲线无穷多个样本数据的频率分布直方图无穷多个样本数据的频率分布直方图00.020.040.060.080.10.120.1412.014.517.019.522.024.527.029.532.000.020.040.060.080.10.120.1412.00 14.50 17.00 19.50 22.00 24.50 27.00 29.50 32.00 1.1.描述连续型随机变量的最重要的分布描述连续型随机变量的最重要的分布 2.2.可
19、用于近似连续型的离散变量的分布可用于近似连续型的离散变量的分布 3.3.经典统计推断的基础经典统计推断的基础xxfx,e21)(2221f(x):随机变量:随机变量 X 的频数的频数 :总体方差:总体方差 =3.14159;e=2.71828x=随机变量的取值随机变量的取值(-x 0正态曲线的最高点在均值,它也是分布的中位数和众数正态分布是一簇分布,每一特定正态分布通过均值和标准差来区分。决定曲线的位置,称为;决定曲线的形状,称为。曲线f(x)相对于均值对称,尾端向两个方向无限延伸,且理论上永远不会与横轴相交正态曲线下的总面积等于1,即概率值等于1随机变量的概率由曲线下的面积给出xCAB?d)
20、()(baxxfbxaPxU 任何一个一般的正态分布,可通过下面的线性变任何一个一般的正态分布,可通过下面的线性变换换 转化为标准正态分布转化为标准正态分布 xufu,e21)(22xU一般正态分布的不同取决于均值一般正态分布的不同取决于均值 和标准差和标准差 计算概率时计算概率时 ,每一个一般正态分布都需要有自己的,每一个一般正态分布都需要有自己的正态概率分布表,这种表格是无穷多的。正态概率分布表,这种表格是无穷多的。若能将一般正态分布转化为标准正态分布,计算概若能将一般正态分布转化为标准正态分布,计算概率时就只需查一张表(标准正态分布表)就可以了。率时就只需查一张表(标准正态分布表)就可以
21、了。先将一个先将一个一般一般正态分布转换为正态分布转换为标准标准正态分布正态分布计算概率时计算概率时,查标准正态概率分布表,查标准正态概率分布表对于负的对于负的 x x ,可由,可由 (-(-x x)-x x 得到得到对于标准正态分布,即对于标准正态分布,即X X N N(0,1(0,12 2),有,有P P(a a X X b b)b b a a P P(|X|(|X|a a)2 2 a a 1 1对于对于一般一般正态分布,即正态分布,即X X N N(,2 2),有,有abbXaP)(12.01052.6xU5 =102.97.1X21.01051.7 21.1059.221xUxU0 =
22、1-.21Z.219525.0)67.1(67.135351035)10(XPXPXP7938.0)1()67.1(67.1351351035352)102(XPXPXP设设XN(1,4),求),求P(0X1.6)解:解:XN(1,4)XN(1,22)故,故,=1,=1,=2=2(0X1.6)1.6101()()22(0.3)(0.5)(0.3)1(0.5)0.6179 1 0.6915 0.3094 主要应用方面:制定考核标准 制定离差评价表 进行人数估算 在综合评价中统一 变量单位1:制作正态曲线的分布草图。2:计算出从 到 ui值所围成的面积概率。3:查表求得各等级的ui值。4:求得各等
23、级标准的原始成绩xi值。1:根据指标总数画好框表。2:将各个指标的平均数填入0标准差等级线与各个指标纵线的交叉处。3:计算1标准差,2标准差,3标准差的对应指标数值,并填入各级标准差等级线与各个指标纵线的交叉处。特别要注意计量的方向性(如:田径中田赛与径赛的计分区别)特别要注意计量的方向性(如:田径中田赛与径赛的计分区别)。4:依据指标成绩基础值和指标变化值画出不同时期的变化图线。5:注意离差等级的划分标准合理制定。(参考标准有两种)(参考标准有两种):1:作正态分布曲线的草图,以确定估计范围。2:求各个区间的ui 值。3:查表找到所估计范围的面积概率。4:计算估计范围的人数。就是依据距离平均
24、数有多少个标准差的距离来确定分数的方法。如果距离平均数在正方向有2个标准差的距离,则记为U分分为2分。在负方向有2个标准差距离,则记为U分分为-2分。直接用u值来评分。是通过U分转换成更加符合实际运用情况的分数计量方法。可以转换为百分计分法,公式为:用于符合正态分布的前提下不等距升分不等距升分的方法之一。其公式为:用于不符合正态分布不符合正态分布的条件下使用变换分数的变量标准化法。其公式见教材P99(5.15)。100650100650Sxxuz需要计算确定)和为某常数。注意这里的为等级变量,为系数,为累进分数,ZZDkyZkDyk(2 关于误差的说明关于误差的说明1 1:随机误差:随机误差偶
25、然因素造成,不可避免,无法消除偶然因素造成,不可避免,无法消除2 2:系统误差:系统误差实验条件和研究方法造成的,可以改善实验条件和研究方法造成的,可以改善3 3:抽样误差:抽样误差抽出的样本统计量之间或样本统计量与总体参数抽出的样本统计量之间或样本统计量与总体参数之间的偏差,主要由于个体间差异造成的,样本含之间的偏差,主要由于个体间差异造成的,样本含量增大时,抽样误差会有减少的趋势量增大时,抽样误差会有减少的趋势4 4:人为误差(过失错误):人为误差(过失错误)人为过失错误造成的统计数据的失真性。人为过失错误造成的统计数据的失真性。统计处理中最关心的是系统误差和抽样误差。统计处理中最关心的是
展开阅读全文