书签 分享 收藏 举报 版权申诉 / 34
上传文档赚钱

类型数据的特征量及统计分析课件.ppt

  • 上传人(卖家):晟晟文业
  • 文档编号:4104931
  • 上传时间:2022-11-11
  • 格式:PPT
  • 页数:34
  • 大小:350.85KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《数据的特征量及统计分析课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    数据 特征 统计分析 课件
    资源描述:

    1、1第一节第一节 数据(资料)的集中量数据(资料)的集中量集中量集中量代表一组数据集中趋势或一般水平的特征量。代表一组数据集中趋势或一般水平的特征量。一、平均数一、平均数 又称均值,能反映一组数据的集中趋势,是一组计又称均值,能反映一组数据的集中趋势,是一组计量资料的代表值,可作为资料代表与另一组资料相比较,以量资料的代表值,可作为资料代表与另一组资料相比较,以明确两组资料之间的差异状况。明确两组资料之间的差异状况。包括包括平均数、中位数、众数平均数、中位数、众数包括:包括:算数平均数、加权平均数、几何平均数、调和平均数。算数平均数、加权平均数、几何平均数、调和平均数。统计分析中,算数平均数应用

    2、最普遍。统计分析中,算数平均数应用最普遍。21.1.算数平均数的计算方法算数平均数的计算方法(1 1)直接计算法直接计算法niixnxxxx1n211n适用于不分组的小样本资料适用于不分组的小样本资料全部数据的全部数据的总和总和除以除以数据总个数数据总个数所得的商,简称均数所得的商,简称均数(meanmean)x(一)(一)算术平均数算术平均数 (arithmetic mean)3(2 2)频数分布表计算法频数分布表计算法求算术平均值的近似值求算术平均值的近似值fXNfffXfXfXfxkkk1212211f f:各组:各组频数频数 X X:各组组中值:各组组中值 k k:组数:组数 N N:

    3、总频数:总频数适用于已经编制成频数分布表的分组数据资料适用于已经编制成频数分布表的分组数据资料4组别组别/分分组中值(组中值(X)频数(频数(f)f X909010010094.594.58 87567568080909084.584.51616135213527070808074.574.51313968.5968.56060707064.564.51111709.5709.55050606054.554.59 9490.5490.54040505044.544.53 3133.5133.5合计合计6060=4410=4410表表3-1 603-1 60个幼儿珠心算成绩平均数计算表个幼儿珠心

    4、算成绩平均数计算表fX例例3-13-1:5.736044101fXNx5(4 4)算术平均数的性质)算术平均数的性质A.A.各观察值的各观察值的总和总和等于平均数的等于平均数的n n倍倍xnx nxxB.B.离均差离均差(各观察值与平均数之差)(各观察值与平均数之差)的总和的总和等于零等于零0 xxC.C.离均差的平方和离均差的平方和比各观察值与比各观察值与任何其它数值的离差的平方和任何其它数值的离差的平方和都小,即都小,即离均差的平方和最小离均差的平方和最小。x)(aaxxx22D.可加性:可加性:yNxNyxN11)(16WWXWWWXWXWXWXNNNw212211WWN N:各观察值的

    5、权重:各观察值的权重 X XN N:具有不同:具有不同权重权重的观察值的观察值 加权平均数计算公式加权平均数计算公式1 1:具有不同具有不同权重(比重)权重(比重)数据数据(或平均数或平均数)的平均数的平均数。二、加权平均数、几何平均数、调和平均数二、加权平均数、几何平均数、调和平均数1.1.加权平均数加权平均数twXX 或7例例3-23-2:学生最终总评成绩为期中考试成绩占:学生最终总评成绩为期中考试成绩占30%30%,期末考试,期末考试成绩占成绩占70%70%。某学生期中考试成绩。某学生期中考试成绩76 76 分,期末考试成绩分,期末考试成绩8282分,分,计算该学生最终总评成绩是多少?计

    6、算该学生最终总评成绩是多少?(分)2.80%70%30%7082%3076wX8N:各组数据的頻数:各组数据的頻数 :各组数据的平均值:各组数据的平均值X 加权平均数计算公式加权平均数计算公式2 2:NXNNNNXNXNXNXKKKt2122119例例3-33-3:某幼儿园大班有四个班,各班人数分别为某幼儿园大班有四个班,各班人数分别为50,52,54,4850,52,54,48,各班绘画成绩平均分数为,各班绘画成绩平均分数为82,83,84,8182,83,84,81,求全年级绘画的平均成绩。求全年级绘画的平均成绩。解:利用加权算数平均数计算法计算得:解:利用加权算数平均数计算法计算得:)(

    7、53.82485452504881548452835082分x102 2.几何平均数几何平均数NNiNiNgXXXXX121 当数据较多时(当数据较多时(n3n3),先计算),先计算对数平均数,再求对数平均数,再求G GO O)(lg1lglglglg21XNNXXXXNg)lg(10NXgX N个数据连乘积的个数据连乘积的N次方根,符号为次方根,符号为 或或 GOgX 几何平均数的应用几何平均数的应用计算计算入学人数增加率、学校经费增加率、阅读能力提高入学人数增加率、学校经费增加率、阅读能力提高率率等。等。11例:例:某市某市6 6年中小学教师的学历达标率分别为年中小学教师的学历达标率分别为

    8、40%40%、52%52%、65%65%、72%72%、78%78%、86%86%,计算该市小学教师,计算该市小学教师6 6年学历平均达标率。年学历平均达标率。解:解:1975.0686.0lg78.0lg72.0lg65.0lg52.0lg40.0lglgG%46.636346.0101975.0G123 3.调和平均数调和平均数用于计算用于计算平均学习速度平均学习速度,如阅读速度、解题速度、识字,如阅读速度、解题速度、识字速度等速度等。)1()111(1121XNXXXNXNH 一组一组数据中数据中每个数据的倒数每个数据的倒数的的算数平均数的倒数算数平均数的倒数,符号为符号为 。HX13二

    9、、中位数二、中位数 (median)MMd d 一组一组依大小排列依大小排列的观察值中的观察值中居中位置的数值居中位置的数值。为偶数时当2为奇数时当12221NxxNxMNNNd 中位数计算法:中位数计算法:1 1、不分组数据不分组数据中位数中位数计算法:计算法:14 2 2、頻数分布表计算法:、頻数分布表计算法:mdmddmdmddfinNUMfinNLM)2()2(21或(1 1)中位数计算公式:)中位数计算公式:L Lmdmd:中位数所在组的下限值;:中位数所在组的下限值;U Umdmd:中位数所在组的上限值;:中位数所在组的上限值;N N:表示总频率;:表示总频率;n n1 1:小于中

    10、位数所在组下限的頻数总和;:小于中位数所在组下限的頻数总和;n n2 2:大于中位数所在组上限的頻数总和;:大于中位数所在组上限的頻数总和;i i:頻数分布表中的组距;:頻数分布表中的组距;f fmdmd:中位数所在组的頻数。:中位数所在组的頻数。15(2 2)利用頻数分布表法计算中位数的步骤:)利用頻数分布表法计算中位数的步骤:计算计算N/2N/2,即数据总頻数的,即数据总頻数的1/21/2;依据依据N/2N/2确定中位数所在组;确定中位数所在组;查找中位数所在组的頻数、下限、上限和组距;查找中位数所在组的頻数、下限、上限和组距;计算计算小于中位数所在组下限的頻数总和小于中位数所在组下限的頻

    11、数总和或或大于中大于中位数所在组上限的頻数总和位数所在组上限的頻数总和;将将总頻数总頻数、中位数所在组的頻数中位数所在组的頻数、下限或上限下限或上限、组距组距、小于中位数所在组下限的頻数总和小于中位数所在组下限的頻数总和或或大于中大于中位数所在组上限的頻数总和位数所在组上限的頻数总和代入中位数计算公式。代入中位数计算公式。中位数是表示数据阵列分布的中心位置,所以是数中位数是表示数据阵列分布的中心位置,所以是数据集中趋势或中心位置的一种重要度量。据集中趋势或中心位置的一种重要度量。中位数不受极端数据的影响,所以常被用作偏斜数中位数不受极端数据的影响,所以常被用作偏斜数据的平均值。据的平均值。16

    12、么么么么方面 Sds绝对是假的三、众数三、众数 (mode)MMo o 一组数据一组数据中出现频数最多的观测值中出现频数最多的观测值或频数最多的或频数最多的一组数据的组中值一组数据的组中值,称为众数,称为众数。众数的计算:众数的计算:A A、观察法观察法求粗略众数求粗略众数:B B、公式法求理论众数的近似值:公式法求理论众数的近似值:若所有数据均不相同,则没有若所有数据均不相同,则没有众数众数。理论理论众数众数和和粗略众数粗略众数:主要众数主要众数和和次要众数次要众数:全局众数全局众数和和局部众数局部众数:众数的众数的适用条件适用条件:18表示一组数据表示一组数据变异性或变异性或离散性离散性的

    13、统计量,又称离中趋势。的统计量,又称离中趋势。一、全距、四分位距与百分位距一、全距、四分位距与百分位距包括包括全距全距、四分位、四分位距(距(差差)、百分位距、百分位距、平均差、平均差、方差方差和和标准差标准差。第二节第二节 数据(资料)的差异量数数据(资料)的差异量数1 1、全距、全距极差极差 全距(全距(R R)=最大值最大值-最小值最小值19四分位数四分位数:把所有数据由小到大排列并分成四等份,处于三:把所有数据由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数。个分割点位置的数值就是四分位数。分别记为:分别记为:第一第一四分位数四分位数 (Q Q1 1),即,即第第2525

    14、百分位数百分位数(P P25 25),又称),又称“较较小四分位数小四分位数”。第二第二四分位数四分位数 (Q Q2 2),即,即第第5050百分位数百分位数(P P50 50),又称),又称“中中位数位数”。第三第三四分位数四分位数 (Q Q3 3),即,即第第7575百分位数百分位数(P P75 75),又称),又称“较较大四分位数大四分位数”。四分位距(四分位距(QDQD)=(Q=(Q3 3-Q-Q1 1)/2)/22 2、四分位距(、四分位距(QDQD)内距或四分位差内距或四分位差 20四分位距反映了数据中间四分位距反映了数据中间50%50%数据的离散程度,数据的离散程度,其数值越小,

    15、说明中间的数据越集中;其数值越大,其数值越小,说明中间的数据越集中;其数值越大,说明中间的数据越分散。说明中间的数据越分散。四分位距的大小在一定程度上可反映中位数对一四分位距的大小在一定程度上可反映中位数对一组数据的代表程度。组数据的代表程度。21A A、未分组数据四分位距计算方法:、未分组数据四分位距计算方法:1 1、进行数据由小到大排序、进行数据由小到大排序 2 2、确定四分位数:、确定四分位数:四分位数值的确定尚存争议四分位数值的确定尚存争议常用方法(常用方法(1 1):):利用四分位数的百分比值(利用四分位数的百分比值(mm)及样本容量()及样本容量(n n)计算确定:)计算确定:情况

    16、情况1:1:如果如果L Lmm是一个整数,则是一个整数,则四分位数的值四分位数的值取第取第L Lmm和第和第L Lmm+1+1两位置数据的平均值。两位置数据的平均值。情况情况2:2:如果如果L Lmm不是一个整数,则取下一个最近的整数作为不是一个整数,则取下一个最近的整数作为L Lm m。(比如(比如L L2525=1.2=1.2,则取则取 2 2)对应的数据作为)对应的数据作为四分位数的值四分位数的值。常用方法(常用方法(2 2):见教材):见教材P P4545:例:例3-123-1275,50,25分别取值为为四分位数的位置)100(mLmnLmm 四分位距的计算:四分位距的计算:22实例

    17、实例1 1:计算下列数据的四分位差计算下列数据的四分位差:6,47,49,15,42,:6,47,49,15,42,41,7,39,43,40,36 41,7,39,43,40,36 实例实例2 2:计算下列数据的四分位差计算下列数据的四分位差:7,15,36,39,40,:7,15,36,39,40,41 41 23B B、分组数据利用百分位数计算公式:、分组数据利用百分位数计算公式:ifFNLPQb25125110025ifFNLPQb753753100752/)(13QQQ24常用百分位距有常用百分位距有2 2种种:(1 1)第)第9090与第与第1010百分位数之差,百分位数之差,即即

    18、P P90 90 PP10 10。(2 2)第)第9393与第与第7 7百分位数之差,百分位数之差,即即P P93 93 PP7 7。3 3、百分位距、百分位距两个百分位数之差两个百分位数之差25二、平均差二、平均差 (MDMD)即即平均离差平均离差。是相对于平均数来衡量一组数据分散程度的变异量。是相对于平均数来衡量一组数据分散程度的变异量。平均差是样本所有数据与其算术平均数的平均差是样本所有数据与其算术平均数的离差离差(离均差离均差)绝对绝对值值的算术平均数的算术平均数。平均差反应各个数据与算术平均数之间的平均差异。平均差反应各个数据与算术平均数之间的平均差异。平均差越大,表明各个数据与算术

    19、平均数的差异程度越大,平均差越大,表明各个数据与算术平均数的差异程度越大,该算术平均数的代表性就越小;该算术平均数的代表性就越小;平均差越小,表明各个数据与算术平均数的差异程度越小,平均差越小,表明各个数据与算术平均数的差异程度越小,该算术平均数的代表性就越大。该算术平均数的代表性就越大。26 未分组数据的平均差的计算公式为:未分组数据的平均差的计算公式为:分组数据的平均差的计算公式为:分组数据的平均差的计算公式为:XXNMD1XmfNMDii1 平均差的计算方法:平均差的计算方法:dMXNMD1diiMmfNMD127三三、方差、方差和标准差和标准差 离均差平方和离均差平方和各观测值各观测值

    20、离均差平方离均差平方的总和,即的总和,即SSSS2XXSS样本:样本:2XSS总体:总体:1 1、方差:一组、方差:一组数据数据离均差平方离均差平方的算术平均数的算术平均数。N-22)(XX2)(XXSS-28一组数据的一组数据的离均差平方和(离均差平方和(SSSS )除以除以总频数总频数或或样本样本容量容量所得的所得的平均的离均差平方平均的离均差平方。记为记为 2 2(总体方差)或(总体方差)或 s s2 2(样本方差)(样本方差)。NX22总体方差:总体方差:nXXs22样本方差:样本方差:方差方差,又称,又称均方均方频数分布表计算频数分布表计算方差:方差:22)(1XmfNii222)(

    21、NmfNmfiiii29方差的平方根,又称为方差的平方根,又称为均方差均方差。记为记为 (总体标准差)或(总体标准差)或 s s (样本标准差)(样本标准差)。标准差标准差频数分布表计算标准差频数分布表计算标准差:2)(1XmfNii22)(NmfNmfiiiinXXs2大样本标准差:大样本标准差:12nXXs小样本标准差:小样本标准差:NX2总体标准差:总体标准差:30标准差的性质标准差的性质(2 2)计算时,各变量同时加上或减去一个常数,其数值)计算时,各变量同时加上或减去一个常数,其数值 不变不变 (3 3)各变量同时乘以或除以一个常数)各变量同时乘以或除以一个常数a a,所得标准差是原

    22、,所得标准差是原来标准差的来标准差的a a倍或倍或1/a1/a倍。倍。(1 1)31标准差的应用:标准差的应用:用于计算变异系数、相关系数、标准系数。用于计算变异系数、相关系数、标准系数。sx 在描述一组资料时集中量常用在描述一组资料时集中量常用 表示,变异量常用表示,变异量常用 s 表示表示x可用可用 同时表示出来。同时表示出来。32标准差与算术平均数的百分比标准差与算术平均数的百分比%XCV100(2 2)比较单位相同但平均数差异很大的两组数据的差异程度。比较单位相同但平均数差异很大的两组数据的差异程度。(3 3)判断特殊差异情况:)判断特殊差异情况:一般一般CVCV值通常为值通常为5%3

    23、5%5%35%。如果。如果CVCV值大于值大于35%35%,可怀,可怀疑所求平均数是否失去意义;如果疑所求平均数是否失去意义;如果CVCV值小于值小于5%5%,可怀疑,可怀疑平均数与标准差是否计算错误。平均数与标准差是否计算错误。(1 1)四四、差异系数(变异系数)差异系数(变异系数)差异系数的用途:差异系数的用途:33描述数据分布特征的统计量。描述数据分布特征的统计量。评估频数分布是否符合正态分布时,可用偏态系数作为评估频数分布是否符合正态分布时,可用偏态系数作为比较性的度量。比较性的度量。皮尔逊偏态系数公式皮尔逊偏态系数公式描述数据分布形态描述数据分布形态(1 1)五五、偏态系数偏态系数 偏态系数的计算方法:偏态系数的计算方法:)(3)23(0ddMXXMXMXSK-当当SK=0SK=0时,分布为对称形;时,分布为对称形;当当SK0SK0时,分布为正偏态;时,分布为正偏态;当当SK0SK0时,分布为负偏态。时,分布为负偏态。34

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:数据的特征量及统计分析课件.ppt
    链接地址:https://www.163wenku.com/p-4104931.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库