书签 分享 收藏 举报 版权申诉 / 53
上传文档赚钱

类型集中趋势课件.ppt

  • 上传人(卖家):ziliao2023
  • 文档编号:6025296
  • 上传时间:2023-05-22
  • 格式:PPT
  • 页数:53
  • 大小:778KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《集中趋势课件.ppt》由用户(ziliao2023)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    集中 趋势 课件
    资源描述:

    1、 本章的内容和重点本章的内容和重点第一节第一节 频数分布频数分布第二节第二节 集中趋势的描述集中趋势的描述第三节第三节 离散趋势的描述离散趋势的描述第四节第四节 描述分布形态的统计指标描述分布形态的统计指标教学目的与要求教学目的与要求 掌握:描述定量资料的集中趋势的指标掌握:描述定量资料的集中趋势的指标算术均数、几算术均数、几何均数、中位数的计算方法和适用条件,描述定量资料的何均数、中位数的计算方法和适用条件,描述定量资料的离散趋势的指标离散趋势的指标极差、四分位数间距、方差、标准差极差、四分位数间距、方差、标准差和变异系数的计算方法和适用条件。和变异系数的计算方法和适用条件。熟悉:连续型变量

    2、频数表的编制,频数分布类型,百分位熟悉:连续型变量频数表的编制,频数分布类型,百分位数法的概念及计算。数法的概念及计算。了解:离散型定量变量的频数分布了解:离散型定量变量的频数分布 单变量计量资料的统计分析单变量计量资料的统计分析 研究总体统计描述样本统计推断随机抽样参数估计假设检验统计表统计图统计指标定量资料的统计描述定量资料的统计描述 统计表频数分布表统计表频数分布表 统计图频数分布图统计图频数分布图 统计指标统计指标 集中趋势:均数、几何均数、中位数集中趋势:均数、几何均数、中位数 离散趋势:极差、四分位间距、方差、标准离散趋势:极差、四分位间距、方差、标准差、变异系数差、变异系数编号编

    3、号 年龄年龄 性别性别 治疗组治疗组 舒张压舒张压 体温体温 疗效疗效 X1 X1 X2X2 X3 X3 X4 X5X4 X5 X6X6 1 37 男男 A 11.27 37.5 显效显效 2 45 女女 B 12.53 37.0 有效有效 3 43 男男 A 10.93 36.5 有效有效 4 59 女女 B 14.67 37.8 无效无效 100 54 男男 B 16.80 37.6 无效无效频数与频数分布频数与频数分布频数与频数分布频数与频数分布频数频数:某个测量值的个(例)数。:某个测量值的个(例)数。频数分布表频数分布表(frequency distribution table):)

    4、:又称频数表,又称频数表,是将是将原始数据值适当分组后得到各组的频数,原始数据值适当分组后得到各组的频数,如表如表2-1频数分布表。频数分布表。适用于适用于样本量较大样本量较大的资料进行统计描述的常用方法。的资料进行统计描述的常用方法。通过频数表可以显示数据分布的范围与形态。通过频数表可以显示数据分布的范围与形态。可用手工和计算机软件(如可用手工和计算机软件(如SASSAS、SPSSSPSS等)方便制作频等)方便制作频数表。数表。频数与频数分布频数与频数分布离散型定量变量的频数分布离散型定量变量的频数分布 例例2-1 19982-1 1998年某山区年某山区9696名孕妇产前名孕妇产前检查次数

    5、资料如下:检查次数资料如下:0 0,3 3,2 2,0 0,1 1,5 5,6 6,3 3,2 2,4 4,1 1,0 0,6 6,5 5,1 1,3 3,3 3,4 4,7 7等共等共9696个数值个数值频数与频数分布频数与频数分布 表表2-12-1:9696名妇女产前检查次数分布的频数分布表名妇女产前检查次数分布的频数分布表表2-1 1998年某地96名妇妇女产产前检查检查次数数分布检查检查次数数频数频数频频率(%)累计计人数数累计频计频率(%)(1 1)(2 2)(3 3)(4 4)(5 5)0 04 44.24.24 44.24.21 17 77.37.3111111.511.52 2

    6、111111.511.5222222.922.93 3131313.513.5353536.536.54 4262627.127.1616163.563.55 5232324.024.0848487.587.55121212.512.59696100.0100.0合计计9696100100 频数与频数分布频数与频数分布图图2-12-1图 2-1 某 地 96名 妇 女 产 前 检 查 次 率 分 布051 01 52 02 53 0012345 5产 前 检 查 次 数频率(%)频数与频数分布频数与频数分布连续型定量变量的频数分布连续型定量变量的频数分布 频数分布表的编制步骤频数分布表的编制步

    7、骤1.1.求极差求极差 2.2.确定组段数、组距确定组段数、组距3.3.从小到大列出组段从小到大列出组段4.4.清点各组段包含的观察单位数(频数)清点各组段包含的观察单位数(频数)5.5.整理成频数分布表整理成频数分布表 频数与频数分布频数与频数分布连续型定量变量的频数分布连续型定量变量的频数分布 例2-2 2-2 抽样调查某市抽样调查某市19971997年年1212岁男童岁男童120120人的身高人的身高(cm)(cm)资料如下。资料如下。将数据适当分组,计数每组的频数,根据这些将数据适当分组,计数每组的频数,根据这些数据编制成的频数分布表(表数据编制成的频数分布表(表2-22-2)则能显示

    8、出这)则能显示出这组数据分布的特点。组数据分布的特点。频数与频数分布频数与频数分布某市1997年12岁男童120人的身高(cm)资料如下。142.3 156.6 142.7 145.7 138.2 141.6 142.5 130.5 134.5 148.8134.4 148.8 137.9 151.3 140.8 149.8 145.2 141.8 146.8 135.1150.3 133.1 142.7 143.9 151.1 144.0 145.4 146.2 143.3 156.3141.9 140.7 141.2 141.5 148.8 140.1 150.6 139.5 146.4

    9、143.8143.5 139.2 144.7 139.3 141.9 147.8 140.5 138.9 134.7 147.3138.1 140.2 137.4 145.1 145.8 147.9 150.8 144.5 137.1 147.1142.9 134.9 143.6 142.3 125.9 132.7 152.9 147.9 141.8 141.4140.9 141.4 160.9 154.2 137.9 139.9 149.7 147.5 136.9 148.1134.7 138.5 138.9 137.7 138.5 139.6 143.5 142.9 129.4 142.5

    10、141.2 148.9 154.0 147.7 152.3 146.6 132.1 145.9 146.7 144.0135.5 144.4 143.4 137.4 143.6 150.0 143.3 146.5 149.0 142.1140.2 145.4 142.4 148.9 146.7 139.2 139.6 142.4 138.7 139.9频数与频数分布频数与频数分布手工编制表手工编制表2-22-2步骤:步骤:(1 1)计算)计算全距全距(rangerange,R R),也称为极差),也称为极差 R R=最大值最小值最大值最小值 =160.9=160.9125.9125.93535

    11、(cmcm)(2 2)确定)确定组段数与组距组段数与组距:组距组距=上限下限上限下限=R R/(预计的组段数)(预计的组段数)i=R/K(极差(极差/组数)组数)本例如果预计取本例如果预计取1010个组段,则组距长度约为个组段,则组距长度约为35/10=3.5,35/10=3.5,取整数取整数4 4。两。两端的组段应分别包含最小值或最大值;端的组段应分别包含最小值或最大值;(3 3)列表列表 做出如表做出如表2-22-2的表格,将选好的组段顺序地列在的表格,将选好的组段顺序地列在 (1)(1)列。按照列。按照 “下限下限x x上限上限”的原则确定每一例数据的原则确定每一例数据x x应归属的组段

    12、。应归属的组段。组组 段段 频频 数数 频频 率率 124124 1 1 0.0083 0.0083 128 128 2 0.01672 0.0167 132 132 1010 0.0833 0.0833 136 136 2222 0.1834 0.1834 140 140 3737 0.3083 0.3083 144 144 2626 0.2167 0.2167 148 148 1515 0.1250 0.1250 152 152 4 4 0.0333 0.0333 156 156 2 2 0.0167 0.0167 160 160 1 1 0.0083 0.0083 合合 计计 12012

    13、0 1.0000 1.0000频数与频数分布频数与频数分布 124132140148156164010203040人数图 某市120名12岁男童身高的频数分布频数分布的类型频数分布的类型 types of frequency distribution对称分布 symmetric distribution 偏态分布 skewness distribution频数表与频数分布频数表与频数分布124132140148156164010203040人数身高(cm)对称分布频数表与频数分布频数表与频数分布偏态分布正偏态(positive skew)负偏态(negative skew)Frequencyv

    14、ar512345678902468Frequencyvar6123456789100510频数表与频数分布非对称分布称为skewness;俗称偏态分布,有人称偏峰分布。“偏”是偏离的意思,表示个别观察值偏离均数较远,而不是“集中位置偏”;频数表与频数分布 分布不对称者称为偏态分布。偏态分布又分为正偏分布和负偏分布。所谓正偏分布是指分布的长尾在峰的右侧,又称右偏分布;所谓负偏分布是指分布的长尾在峰的左侧,又称左偏分布。”频数表与频数分布频数表与频数分布70 3 5 7 9 11 13 15 17 19 21 10 20 30 40 50 60 0 1 人数大多数居民发汞含量在115mol/kg之

    15、间,少数人的发汞大于15mol/kg,分布呈正偏态。发汞含量(mol/kg)(a)239人发汞含量的频数分布图 某城市892名老年人生存质量自评分的频数分布0 10 20 30 40 50 60 70 80 90 100自评分400300200100 0人数0 5 10 15 20 25 30 35 40 45 0 1 02 03 040(b)102名黑色素瘤患者的生存时间频数分布人数生存时间(月)患者生存时间大部份在30个月内,少数达45个月,分布呈极度偏态,又称L型分布。图 某地19901992年男性死亡年龄分布 0 5 10 15 20 25 30 35 40 45 50 55 60 6

    16、5 70 75 80 85死亡年龄(岁)2500200015001000 500 0频数分布表和频数分布图的用途频数分布表和频数分布图的用途 描述分布类型描述分布类型 描述分布的特征描述分布的特征 集中趋势反映资料的平均水平集中趋势反映资料的平均水平 离散趋势反映资料的变异程度离散趋势反映资料的变异程度 便于发现特大、特小的可疑值便于发现特大、特小的可疑值 便于计算有关指标、统计分析与处理便于计算有关指标、统计分析与处理 求出极差 确定组段数 确定组距 列出各个组段 确定每一组段频数极差即最大值与最小值之差 一般815之间 组距=R/组段数,但一般取一方便计算的数字 第一组段包括极小值,最后一

    17、组段包括极大值,除最后一组段可同时标出上下限,其他组段只标出下限。根据变量值大小把各观察单位归入各个组段 编制频数表步骤流程图频数分布特征频数分布特征 124132140148156164010203040人数图 某市120名12岁男童身高的频数分布第二节第二节 集中趋势统计指标集中趋势统计指标 平均数平均数:描述一组变量值集中位置的特征值,用来描述一组变量值集中位置的特征值,用来 说明某种现象或事物数量的平均水平说明某种现象或事物数量的平均水平 适用条件适用条件:适用于:适用于正态分布正态分布或或近似正态分布近似正态分布的资料的资料 (对称分布对称分布)1 1)直接计算法)直接计算法:计算公

    18、式为计算公式为 式中式中X X1 1,X,X2 2和和XnXn为所有观察值,为所有观察值,n n为样本含量,为样本含量,(希(希腊字母,读作腊字母,读作sigmasigma)为求和的符号)为求和的符号。nXXXxn .21nXnXnXiinii1一、算术均数:简称均数,用 表示(样本均数)X定量变量的特征数定量变量的特征数2 2)加权频数表法:)加权频数表法:计算公式为计算公式为nfXffXxOO120例17岁男生的身高频数分布均数的应用:最适于对称分布资料,特别是正态分布资料;对于偏态资料,均数不能较好地反映其集中趋势。我也知道了!定量变量的特征数定量变量的特征数二、几何均数(二、几何均数(

    19、geometric meangeometric mean,G G)适用条件:适用条件:适用于对数正态分布或近似正态分布,以适用于对数正态分布或近似正态分布,以及呈倍数关系的等比资料。其频数图一般呈正偏峰分布。及呈倍数关系的等比资料。其频数图一般呈正偏峰分布。在医学研究中常适用于免疫学的指标。其计算公式为在医学研究中常适用于免疫学的指标。其计算公式为 nXXXXGnnlglg.121定量变量的特征数定量变量的特征数例例2-5 72-5 7名慢性迁延性肝炎患者的名慢性迁延性肝炎患者的HBsAgHBsAg滴度资料滴度资料为为1:161:16,1:321:32,1:321:32,1:641:64,1:

    20、641:64,1:1281:128,1:5121:512。试计算其几何均数。试计算其几何均数。6451212864643232167G)log(log1nXG.648062.1lg7512lg128lg64lg64lg32lg32lg16lglg11定量变量的特征数定量变量的特征数加权法计算几何均数例例2-6 522-6 52例慢性肝炎患者的例慢性肝炎患者的HBsAgHBsAg滴度数据如表滴度数据如表2-2-4 4。试计算滴度的几何均数。试计算滴度的几何均数。nXffXfGloglgloglog11定量变量的特征数定量变量的特征数表2-4 52例慢性肝炎患者的HBsAg滴度资资料抗体滴度频数频

    21、数(f f)滴度倒数数(X X)lgXf(lgX)1:162 216161.204121.204122.408242.408241:327 732321.505151.5051510.5360510.536051:64111164641.806181.8061819.8679819.867981:12813131281282.107212.1072127.3937327.393731:25612122562562.408242.4082428.8988828.898881:5127 75125122.709272.7092718.9648918.96489合计计5252108.06977108

    22、.06977定量变量的特征数定量变量的特征数 52 52例慢性肝炎患者的例慢性肝炎患者的HBsAgHBsAg滴度的几何均数为滴度的几何均数为 1119.747051119.74705。74705.1195206977.108lg1G111lg150.2778lg()lg()lg(2.1779)150.669fXGf几何均数的应用:1.等比资料,如抗体平均滴度2.对数正态分布资料Remember!使用几何均数时的注意点:1)观察值不能有0。2)观察值不能同时有正值和负值。若全为负值,在计算时先把负号去掉,得出结果再加上负号。Be careful!定量变量的特征数定量变量的特征数三、中位数(三、中

    23、位数(median,M)适用条件:适用条件:可用于各种分布的定量资料。尤其用于可用于各种分布的定量资料。尤其用于偏态分布资料、一端或两端无确定数据资料和分布不明偏态分布资料、一端或两端无确定数据资料和分布不明的资料。的资料。M:将全部观察值:将全部观察值从小到大从小到大排序,位于排序,位于中间位置中间位置的观察值的观察值 如如 今有今有6名工人接触某有害物质后,引起中名工人接触某有害物质后,引起中毒的潜伏期分别是:毒的潜伏期分别是:1天,天,3天,天,5天,天,4天,天,8天,天,7天。该天。该6位工人的平均潜伏期是多少位工人的平均潜伏期是多少天?天?中位数例 9例正常人的发汞值:1.1 1.

    24、8 3.5 4.2 4.8 5.6 5.9 7.1 10.5 M=4.8 9例正常人的发汞值:1.1,1.8 3.5 4.2 4.8 5.6 5.9 7.1 16 M=4.8 10例正常人的发汞值:1.1 1.8 3.5 4.2 4.8 5.6 5.9 7.1 10.5 16 M=(4.8+5.6)/2=5.2%X(100)%XXP 百分位数示意图(二)百分位数(percentile)百分位数法计算中位数百分位数法计算中位数:频数表资料(大样本)频数表资料(大样本)百分位数的计算公式为百分位数的计算公式为 式中式中L LX X、i iX X和和f fX X分别为第百分位数所在组段的下限、组分别

    25、为第百分位数所在组段的下限、组距和频数,距和频数,fLfL为小于各组段的累计频数,为小于各组段的累计频数,L LX X为总为总例数。中位数的计算公式例数。中位数的计算公式(%)XXXLXiPLnXff 50505050()2LinMPLff表表2-5 120名正常成年男子血清铁含量(名正常成年男子血清铁含量(mol/L)组段组段频数频数f累计频数累计频数f累计频率累计频率%6110.838343.33106108.331281815.0014123025.0016205041.6718277764.172018221224826428301合计合计120)/(74.18)50%50120(27

    26、218LmolM定量变量的特征数定量变量的特征数120例17岁男生的身高频数分布百分位数的应用:百分位数用于描述某个观察序列在某百分位置上的水平。常用于确定参考值范围,亦称正常值范围。平均数应用的注意事项平均数应用的注意事项 同质同质的资料计算平均数才有意义的资料计算平均数才有意义 根据资料分布的特征选用适当的平均数根据资料分布的特征选用适当的平均数 算术均数:单峰对称分布的资料算术均数:单峰对称分布的资料 几何均数:等比资料、滴度资料、正偏态资料几何均数:等比资料、滴度资料、正偏态资料 中位数:理论上可用于任何分布资料,但当资料适合中位数:理论上可用于任何分布资料,但当资料适合计算均数或几何

    27、均数时,不宜用中位数计算均数或几何均数时,不宜用中位数(偏态分布、分布不明资料、有不确定值的资料)(偏态分布、分布不明资料、有不确定值的资料)1 1 有有5 5人的血清滴度为:人的血清滴度为:1:20,1:40,1:80,1:160,1:3201:20,1:40,1:80,1:160,1:320则平均则平均滴度是滴度是 A.1A.1:4040 B.1 B.1:8080 C.1 C.1:160160 D.1 D.1:320320 2.2.一组变量值,其大小分别为一组变量值,其大小分别为1010,1212,9 9,7 7,1111,其中位数是,其中位数是 A.9A.9 B.7 B.7 C.10 C

    28、.10 D.11 D.113.3.一组变量值,其大小分别为一组变量值,其大小分别为1010,1212,9 9,7 7,1111,3939,其中位数,其中位数是是 A.9A.9 B.7 B.7 C.10.5 C.10.5 D.11 D.11 4.4.正常成年男子的血铅含量系偏态分布资料正常成年男子的血铅含量系偏态分布资料,对数变换后对数变换后的呈正态分布。欲描述血铅的平均水平宜用的呈正态分布。欲描述血铅的平均水平宜用A.A.原始数据的算术均数原始数据的算术均数B.B.原始数据的几何均数原始数据的几何均数C.C.原始数据的中位数原始数据的中位数D.D.原始数据的标准差原始数据的标准差 5.5.偏态分布数值资料偏态分布数值资料,对数变换后对数变换后,分布仍呈偏态。描述分布仍呈偏态。描述数据的集中趋势宜用数据的集中趋势宜用A.A.算术均数算术均数B.B.几何均数几何均数C.C.中位数中位数D.D.标准差标准差

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:集中趋势课件.ppt
    链接地址:https://www.163wenku.com/p-6025296.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库