计量资料的统计描述课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《计量资料的统计描述课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计量 资料 统计 描述 课件
- 资源描述:
-
1、第十一章第十一章 资料的描述性分析资料的描述性分析2022-6-92第十一章第十一章 资料的描述性分析资料的描述性分析v第一节第一节 计量资料的统计描述方法计量资料的统计描述方法v第二节第二节 计数资料的统计描述方法计数资料的统计描述方法v统计图表统计图表2022-6-93第一节第一节 计量资料的统计描述方法计量资料的统计描述方法v 常用的描述定量资料分布规律的统计方法常用的描述定量资料分布规律的统计方法有两类:有两类: 统计图表:频数分布表统计图表:频数分布表/图图 选用适当的统计指标:选用适当的统计指标: 集中趋势指标:均数、中位数集中趋势指标:均数、中位数 离散趋势指标:极差、标准差离散
2、趋势指标:极差、标准差2022-6-94v频数分布表频数分布表( frequency distribution table ): 将变量值化分为若干个组段,清点并记录各组段变量值的个数,称为频数表(frequency table ) 。第一节第一节 数值变量资料的频数分布数值变量资料的频数分布2022-6-95最小最小值值最大值第一节第一节 数值变量资料的频数分布数值变量资料的频数分布2022-6-961. 频数表的编制步骤频数表的编制步骤v(1)求数据的极差)求数据的极差: 极差(极差(range)是全部数)是全部数据中的最大值与最小值之差,它描述了数据的变据中的最大值与最小值之差,它描述了
3、数据的变异幅度。异幅度。 公式:公式:RXMaxXMin 例例8.1: XMax =5.59 XMin =3.60 R=5.59-3.60=1.99 第一节第一节 数值变量资料的频数分布数值变量资料的频数分布2022-6-97 (2)划分组段)划分组段v 确定组数确定组数: n100,1015组;组;n100,810组组v 确定组距:确定组距: 组距可以相等也可以不相等,一般采用等距分组,组距可以相等也可以不相等,一般采用等距分组, 组距组距=极差极差/组数组数 例8.1 1.99/102,故组距,故组距=2mmol/L1. 频数表的编制步骤频数表的编制步骤2022-6-98(2)划分组段)划
4、分组段 v 确定各组段的上下限:确定各组段的上下限: 每个组段的起点称为该组的每个组段的起点称为该组的下限(low limit), 终点称为终点称为上限(upper limit), 上限上限=下限下限+组距;组距; 第一组段必须包括最小值,因此其下限取包含最小值、较为第一组段必须包括最小值,因此其下限取包含最小值、较为整齐的数值;整齐的数值;例8.1 第一组段下限为第一组段下限为 3.60,上限为,上限为3.60+0.20=3.80 各组段不能重叠,每一组段均为半开半闭区间,即包括下限,各组段不能重叠,每一组段均为半开半闭区间,即包括下限,不包含上限。不包含上限。例8.1 第一组段为第一组段为
5、3.60 即即3.60,3.80);以此类推。;以此类推。 最后一组段,须包括最大值,且要列出这一组段的下限和最后一组段,须包括最大值,且要列出这一组段的下限和上限,即上限,即5.405.60, 5.40,5.60 1. 频数表的编制步骤频数表的编制步骤2022-6-991. 频数表的编制步骤频数表的编制步骤最后一组段最后一组段第一组段第一组段列出各组段列出各组段2022-6-910(3)列表划记)列表划记v 1. 频数表的编制步骤频数表的编制步骤将原始数据一一对将原始数据一一对应入每个组段,通应入每个组段,通过划过划“正正” 字,来字,来统计每个组段内的统计每个组段内的数据数据2022-6-
6、911(3 3)列表划记)列表划记1. 频数表的编制步骤频数表的编制步骤统计每个组段内的统计每个组段内的频数(例数)频数(例数)频数的合计数等于频数的合计数等于样本含量样本含量2022-6-9121. 频数表的编制步骤频数表的编制步骤(3 3)列表划记)列表划记计算出每个组段的计算出每个组段的频率频率每组的频数每组的频数 样本含量样本含量2022-6-9131. 频数表的编制步骤频数表的编制步骤(3 3)列表划记)列表划记计算出每个组段的计算出每个组段的累计频率累计频率= =本组段的频率本组段的频率+ +上上一组段的累计频率一组段的累计频率2022-6-9141. 频数表的编制步骤频数表的编制
7、步骤2022-6-9152.绘制频数分布直方图绘制频数分布直方图 绘制频数分布直方图绘制频数分布直方图v坐标轴坐标轴 横坐标:变量值即研究指标,无需从横坐标:变量值即研究指标,无需从0开始,以单位尺度开始,以单位尺度划分。划分。 纵坐标:为频数纵坐标:为频数f,必须从,必须从0开始(开始(f为每一组段内的人数)为每一组段内的人数)v直条直条 直条的宽度:组距直条的宽度:组距 直条的高度:每一组段的频数直条的高度:每一组段的频数v累计累计2022-6-9162.绘制频数分布直方图绘制频数分布直方图2022-6-9172.绘制频数分布直方图绘制频数分布直方图2022-6-9183、频数分布的特征、
8、频数分布的特征从频数表可以看到频数分布的两个重要的特征从频数表可以看到频数分布的两个重要的特征 v 集中趋势(集中趋势(central tendency) 血糖值向中央部分(中等水平)集中,以中等水平的血糖值者居血糖值向中央部分(中等水平)集中,以中等水平的血糖值者居多,是为集中趋势。多,是为集中趋势。v 离散趋势(离散趋势(tendency of dispersion) 从中央部分到两侧(血糖值从中等水平到较低或较高水平)的频从中央部分到两侧(血糖值从中等水平到较低或较高水平)的频数分布逐渐减少,是为离散趋势。数分布逐渐减少,是为离散趋势。v 集中趋势和离散趋势是频数分布的两个重要侧面,从这
9、两集中趋势和离散趋势是频数分布的两个重要侧面,从这两方面就可全面的分析所研究的事物。方面就可全面的分析所研究的事物。2022-6-9194.频数分布的类型频数分布的类型 频数分布又可分为对称分布和偏态分布频数分布又可分为对称分布和偏态分布v对称分布:对称分布:集中位置在正中,左右两侧频数分布大体对称v偏态分布:偏态分布:集中位置偏向一侧,频数分布不对称 正偏态分布:集中位置偏向年龄小的一侧正偏态分布:集中位置偏向年龄小的一侧 负偏态分布:集中位置偏向年龄大的一侧负偏态分布:集中位置偏向年龄大的一侧v 不同类型的分布,应采用相应的统计分析方不同类型的分布,应采用相应的统计分析方法。法。2022-
10、6-9204.频数分布的类型频数分布的类型正态分布正态分布( normal distribution )中间高、两边低、左右对称属于对称分布的一种许多医学资料都属于这种分布,例如人体正常的生理生化指标正态分布正态分布2022-6-9214.频数分布的类型频数分布的类型 a.a.尖峭峰尖峭峰 b.b.正态峰正态峰c.c.平阔峰平阔峰2022-6-922正偏态分布正偏态分布正偏态分布:正偏态分布:峰偏左,尾部向右侧延伸峰偏左,尾部向右侧延伸如:以儿童为主的传染病发病人数的分布如:以儿童为主的传染病发病人数的分布右偏态右偏态4.频数分布的类型频数分布的类型负偏态分布负偏态分布负偏态分布:负偏态分布:
11、峰偏右,尾部向左侧延伸峰偏右,尾部向左侧延伸如:以老年人为主的慢性病发病人数的分布如:以老年人为主的慢性病发病人数的分布左偏态左偏态(positive skewed)(negative skewed)2022-6-9235.频数表的用途频数表的用途v频数表可揭示资料的频数表可揭示资料的分布特征分布特征和和分布类型分布类型v便于进一步计算统计指标和统计分析处理(第二节)便于进一步计算统计指标和统计分析处理(第二节)v便于发现某些特大或特小可疑值,便于资料的校对。便于发现某些特大或特小可疑值,便于资料的校对。2022-6-924一、集中趋势指标一、集中趋势指标v算术均数算术均数(arithmeti
12、c mean)v几何均数几何均数(geometric mean)v中位数和百分位数中位数和百分位数(median percentile)以上统称为以上统称为平均数(平均数(average)常用于描述一组常用于描述一组变量值的集中位置,代表其平均水平或是集中变量值的集中位置,代表其平均水平或是集中位置的特征值。位置的特征值。2022-6-9251.算术均数算术均数又简称为又简称为均数(均数(mean)v定义:定义:是反映一组观察值在数量上的平均水平。是反映一组观察值在数量上的平均水平。 总体均数用希腊字母总体均数用希腊字母 表示,样本均数用表示,样本均数用 表示表示v计算方法:计算方法: 直接法
13、:直接法: 频数表法:频数表法:v应用:应用: 正态分布或近似正态分布资料正态分布或近似正态分布资料 x(arithmetic mean)(arithmetic mean)2022-6-9261.算术均数算术均数计算方法计算方法v直接法:即将所有观察值直接法:即将所有观察值x1,x2,x3,xn直接相加直接相加再除以观察值的个数,写成公式再除以观察值的个数,写成公式nxnxxxxxin.321 为样本均数为样本均数 n n为变量值个数,为变量值个数,i i为各变量值,为各变量值, 表示求和表示求和x2022-6-9271.算术均数算术均数 例例1 有有9名健康成人的空腹胆固醇测定值名健康成人的
14、空腹胆固醇测定值(mmol/L)为)为5.61,3.96,3.67,4.99,4.24,5.06,5.20,4.79,5.93,求算术均数。,求算术均数。 L)4.83(mmol/ /95.93)3.96(5.61 x2022-6-9281.算术均数算术均数 计算方法计算方法v 频数表法(频数表法(weighting method) 当资料中相同观察值的个数较多时,可将相同观察值的个数,当资料中相同观察值的个数较多时,可将相同观察值的个数,即频数即频数f,乘以该观察值,乘以该观察值x,以代替相同观察值逐个相加。,以代替相同观察值逐个相加。 对于频数表资料,用各组段的频数作对于频数表资料,用各组
15、段的频数作f,以相应的组中值,以相应的组中值(class mid-value)作)作x。组中值=(下限+上限)/ 2 公式 f fi i为各组段的频数为各组段的频数x xi i为各组段的组中值为各组段的组中值fxfffffxfxfxfxfxiinnn.3213322112022-6-9291.算术均数算术均数2022-6-9301.算术均数算术均数组中值组中值= =(下限(下限+ +上限)上限)/ 2/ 2如:如:3.603.60组段的组中值组段的组中值= =(3.60+3.803.60+3.80)/2=3.70/2=3.70以此类推以此类推/L)4.653(mmol132614.2fxfxi
16、i2022-6-931vf1, f2,fk分别为各组段的频数,这里的分别为各组段的频数,这里的f起到了起到了“权数权数”的作用,它权衡了各组中值由于频数不的作用,它权衡了各组中值由于频数不同对均数的影响。即频数多,权数大,作用也大;同对均数的影响。即频数多,权数大,作用也大;频数少,权数小,作用也小,故称为加权法。频数少,权数小,作用也小,故称为加权法。1.算术均数算术均数用组中值,加用组中值,加权法计算出的权法计算出的均数是精确值均数是精确值吗?吗?2022-6-932 均数的两个重要特性均数的两个重要特性v各离均差(即各观察值各离均差(即各观察值x与均数与均数 x之差)的总和等之差)的总和
17、等于零。于零。v离均差的平方和小于个观察值离均差的平方和小于个观察值x与任何数与任何数( x )之差的平方和。)之差的平方和。1.算术均数算术均数0)(xx22)(xxx)(2022-6-9331.算术均数算术均数0).()(.)(02121nxnxxnxxxxxxxxxxxxxiinn)()()(论论证证:v各离均差(即各观察值各离均差(即各观察值x x与均数与均数 x x之差)的总和等于零。之差)的总和等于零。偶知道另一个也能偶知道另一个也能证明了!嘿嘿证明了!嘿嘿2022-6-934v1 1、最常用,特别是正态分布资料、最常用,特别是正态分布资料v2 2、均数对极值特别敏感,、均数对极值
18、特别敏感, 极大值或极小值通常将均数拉向自极大值或极小值通常将均数拉向自己己1.算术均数算术均数均数的特征均数的特征2022-6-935CASIO fx-3600PCASIO fx-3600P计算器统计功能计算器统计功能 步骤步骤 键键 盘盘 说说 明明 1. MOOD 3 进入进入SD统计功能统计功能 2. SHIFT AC 清除原有数据清除原有数据 3. 2.35 DATA 输入数据输入数据 4.21 DATA 3.32 DATA 4. SHIFT 1(数字键)(数字键) 显示计算的显示计算的 5. SHIFT 3 (数字键)(数字键) 显示计算的显示计算的S 6. Kout 3 (数字键
19、)(数字键) 显示计算的显示计算的n 7. Kout 1 (数字键)(数字键) 显示计算的显示计算的xX 2022-6-9362.几何均数几何均数v定义:定义:有些医学资料,如抗体滴度、细菌计数等,其频有些医学资料,如抗体滴度、细菌计数等,其频数分布明显偏态,各观察值之间呈倍数变化(等比关系),数分布明显偏态,各观察值之间呈倍数变化(等比关系),此时宜用几何均数反映其平均增减倍数。此时宜用几何均数反映其平均增减倍数。v计算方法:计算方法: 直接法直接法 加权法加权法v应用:等比资料或对数正态分布资料应用:等比资料或对数正态分布资料(geometric mean)2022-6-937 计算方法:
20、计算方法:v直接法:直接法:直接将直接将n个观察值(个观察值( x1,x2,x3,xn )的乘积)的乘积开开n次次 公式公式 写成对数形式为写成对数形式为 2.几何均数几何均数nnxxxxG.,321)lg(lg)lg.lglg(lg1211nxnxxxGin几何均数:几何均数:变量对数值变量对数值的算术均数的算术均数的反对数。的反对数。2022-6-938v例例3 有有7 7份血清的抗体效价分别为份血清的抗体效价分别为1:21:2,1:41:4,1:81:8,1:161:16,1:321:32,1:641:64,1:1281:128,求平均抗体效价。,求平均抗体效价。 本例先求抗体效价的倒数
21、,再求几何均数本例先求抗体效价的倒数,再求几何均数2.几何均数几何均数16)204. 1 (lg7128lg.4lg2lglg11G血清抗体的平均效价为血清抗体的平均效价为1 1:16162022-6-939计算方法:计算方法:v加权法:加权法:当资料中相同观察值得个数当资料中相同观察值得个数f(即频数)(即频数)较多时,如频数表资料较多时,如频数表资料 写成公式写成公式2.几何均数几何均数)lg(lg1fxfG2022-6-940v例例4 有有6060人的血清抗体效价,分别为人的血清抗体效价,分别为7 7人人1 1:5 5,1111人人 1 1:1010,2222人人1 1:2020,121
22、2人人1 1:4040,8 8人人1 1:8080,求,求平均抗体效价。平均抗体效价。 2.几何均数几何均数705.20)3161.1 (lg)8122211780lg8.10lg115lg7(lg11G6060人的血清平均抗体效价为人的血清平均抗体效价为1 1:20.70520.7052022-6-941 注意事项注意事项 等比资料,如:抗体的平均滴度、药物的平均效价、卫生事等比资料,如:抗体的平均滴度、药物的平均效价、卫生事业平均发展速度、人口的几何增长业平均发展速度、人口的几何增长 对数正态分布:是右偏态分布对数正态分布:是右偏态分布 观察值不能有观察值不能有0 0。因为。因为0 0不能
23、去对数,不能与任何其他数呈倍不能去对数,不能与任何其他数呈倍数关系。数关系。 观察值不能同时有正值和负值。若全是负值,计算是可以把观察值不能同时有正值和负值。若全是负值,计算是可以把负号去掉,得出结果后再加上负号。负号去掉,得出结果后再加上负号。 同一组资料求得的几何均数小于算术均数。同一组资料求得的几何均数小于算术均数。2.几何均数几何均数2022-6-942 若一组数值变量资料为偏态分布,变量为若一组数值变量资料为偏态分布,变量为x x,令,令y=lgxy=lgx后,后,变量变量y y服从正态分布,请问变量服从正态分布,请问变量x x为什么样的偏态分布资料?为什么样的偏态分布资料?2.几何
24、均数几何均数正偏态分布正偏态分布正态分布正态分布变量变量y 服从服从则变量则变量x服从服从抗体滴度抗体滴度 人数人数, ,f f 滴度倒数滴度倒数, ,X X lglgX X1:2.51:101:401:1601:640 合计合计141822126722.510.040.0160.0640.00.39791.00001.60212.20412.8062102.1032 2022-6-9433.中位数和百分位数中位数和百分位数v(1)中位数)中位数 定义:定义:是将一组观察值从小到大按顺序排列,位次居是将一组观察值从小到大按顺序排列,位次居中的中的观察值观察值就是中位数。就是中位数。 例:例:(
25、 ((median percentile)) ) X X: 5 5,5 5, 6 6, 7 7, 2020, 位次:位次: 1 2 3 4 51 2 3 4 5中位数中位数(M): 6 66.56.523 23 6 62022-6-944(1)中位数)中位数 计算方法: 直接由原始数据计算中位数先将观察值按大小顺序排列,再按下面公式计算:212221nnnXXMnXMn为偶数时:为奇数时:为为相相应应为为此此上上的的观观察察值值位位次次为为有有序序数数列列中中观观察察值值的的12221)12()2()21(nnnxxxnnn、2022-6-945 例例5 有有7 7名正常人的血压(舒张压)测定
展开阅读全文