定量资料数据的统计描述课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《定量资料数据的统计描述课件.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 定量 资料 数据 统计 描述 课件
- 资源描述:
-
1、第二章第二章 定量资料的统计描述定量资料的统计描述定量资料的定量资料的统计描述统计描述统计图表:频数分布表(图)统计图表:频数分布表(图)统计指标:统计指标:集中趋势指标集中趋势指标离散趋势指标离散趋势指标 利用统计表对数据进行概括,用统计图对分布形态利用统计表对数据进行概括,用统计图对分布形态及分布间的关系做直观的表达,用于描述定量资料的统及分布间的关系做直观的表达,用于描述定量资料的统计指标的意义与计算。计指标的意义与计算。第一节第一节频数与频数分布频数与频数分布频数频数(frequency):对一个随机变量做重复观察,:对一个随机变量做重复观察,其中某变量值出现的次数。其中某变量值出现的
2、次数。频数分布表频数分布表(frequency distribution table):将各变:将各变量值及其相应的频数列成表格的形式。量值及其相应的频数列成表格的形式。例例2-2抽样调查某地抽样调查某地120名名18岁岁35岁健康男性居岁健康男性居民血清铁含量民血清铁含量(mol/L)见见P12,试编制频数分布表。试编制频数分布表。频数表的编制:频数表的编制:一、连续型定量变量的频数分布一、连续型定量变量的频数分布步骤:步骤:(1)求全距:(极差)求全距:(极差)R=29.64-7.42=22.22(2)定组段数与组距定组段数与组距:815个组段,组距个组段,组距i=全距全距/组段数组段数(
3、3)划组段:以一个稍小于或等于最小值的整数作为第一个划组段:以一个稍小于或等于最小值的整数作为第一个组段的起点数据。组段的起点数据。下限:每个组段的起点下限:每个组段的起点(最小值最小值)。上限:每个组段的终点上限:每个组段的终点(近似最大值)。近似最大值)。注:最后一个组段应同时写出上限和下限来。注:最后一个组段应同时写出上限和下限来。(4)绘制整理表绘制整理表“下限下限x上限上限”注:各组段的频数之和应等于总的观察例数。注:各组段的频数之和应等于总的观察例数。两端的组段应分别包含最小值或两端的组段应分别包含最小值或最大值;最大值;尽量取较整齐的数值作为组段的尽量取较整齐的数值作为组段的端点
4、,便于对数据进行表述;端点,便于对数据进行表述;组距以相等为宜。组距以相等为宜。表表2120名正常成年男子血清铁含量的频数分布表名正常成年男子血清铁含量的频数分布表681012141618202224262830合计合计一上正一正上正正丅正正正正正正正正正丅正正正上正正丅正上止一13681220271812841组段划记频数120二、离散型定量变量的频数分布二、离散型定量变量的频数分布离散型变量的频数分布图离散型变量的频数分布图直条图直条图 横坐标为产前检查次数;纵坐标为 频率,即产前检查K次的妇女在被统计妇女中所占的比例%。图中等宽矩形长条的高度与相应检查次数的频率呈正比。频率:各组的频数除
5、以总例数频率:各组的频数除以总例数n所得的比值。所得的比值。频率描述了各组频数在全体中所占的比重,各组频率描述了各组频数在全体中所占的比重,各组频率之和等于频率之和等于100%。累计频数:本组段的频数与以前各组段的频数累计频数:本组段的频数与以前各组段的频数相加;相加;累计频率:每组段的累计频数除以总例数。累计频率:每组段的累计频数除以总例数。连续变量的频数分布图连续变量的频数分布图连续型变量的频数分布图,以直方的面积大小表连续型变量的频数分布图,以直方的面积大小表示频率的多少。示频率的多少。等距分组等距分组以横轴表示被观察变量,纵轴表示频率密度,以以横轴表示被观察变量,纵轴表示频率密度,以各
6、矩形(宽度为组距)的面积代表各组段的频率。各矩形(宽度为组距)的面积代表各组段的频率。直方图直方图 图中横轴为血清铁含量,纵轴为频率密度,直条面积等于相应组段的频率。三、三、频数分布的两个特征频数分布的两个特征 集中趋势:血清铁含量向中央部分集中,集中趋势:血清铁含量向中央部分集中,即中等含量者居多,集中在即中等含量者居多,集中在18这个组段,这种现象为集中趋势。这个组段,这种现象为集中趋势。离散趋势:从中央部分到两侧的频数分布离散趋势:从中央部分到两侧的频数分布逐渐减少,而且逐渐减少,而且血清铁含量血清铁含量的值参差不齐,的值参差不齐,最低的接近最低的接近6,最高的接近,最高的接近30,这种
7、现象称为离散趋势。这种现象称为离散趋势。Lmol/Lmol/Lmol/由于同质性,所有实测值趋向由于同质性,所有实测值趋向同一数值的趋势称为集中趋势。同一数值的趋势称为集中趋势。离散趋势或变异程度是指观察离散趋势或变异程度是指观察值之间参差不齐的程度。值之间参差不齐的程度。频数分布频数分布四、频数分布的类型四、频数分布的类型对称分布型:指集中位置在正中,左右对称分布型:指集中位置在正中,左右两侧频数分布大体对称两侧频数分布大体对称。偏态分布型:指集中位置偏向一侧,频数偏态分布型:指集中位置偏向一侧,频数分布不对称。分布不对称。偏态分布型偏态分布型正偏态分布:集中位置偏向数值小的一侧。正偏态分布
8、:集中位置偏向数值小的一侧。负偏态分布:集中位置偏向数值大的一侧负偏态分布:集中位置偏向数值大的一侧。频数表的用途频数表的用途 1.揭示频数分布的分布特征和分布类型揭示频数分布的分布特征和分布类型。文献中常将频数表作为陈述资料的形式。2.便于进一步计算统计指标和进行统计分析处理。便于进一步计算统计指标和进行统计分析处理。3.便于发现某些特大或特小的可疑值。便于发现某些特大或特小的可疑值。90 1 92 0 94 0 96 0 98 0 100 0 110 112 114 116 118 120 122 124 126 128 130 132 134 1361399151821141043211
9、10名名7岁男童身高(岁男童身高(cm)的频数分布)的频数分布第二节第二节定量变量的特征数定量变量的特征数 总体中的某些个体总是具有某些同质性,同一地区、同总体中的某些个体总是具有某些同质性,同一地区、同一年度、同一民族、同一年龄段、相同的性别与类似的健康一年度、同一民族、同一年龄段、相同的性别与类似的健康状况,这些共同点使得该人群的血清铁含量应趋向同一数值,状况,这些共同点使得该人群的血清铁含量应趋向同一数值,即即集中趋势集中趋势。不同总体间比较的方式之一就是对他们的集中。不同总体间比较的方式之一就是对他们的集中趋势进行比较。另一方面,同一总体中的个体之间又普遍存趋势进行比较。另一方面,同一
10、总体中的个体之间又普遍存在着各种差别,也就是说由于遗传、营养、行为、发育、心在着各种差别,也就是说由于遗传、营养、行为、发育、心理的各种因素在个体之间都不会完全相同,即个体间存在差理的各种因素在个体之间都不会完全相同,即个体间存在差异,因此导致某地异,因此导致某地18-3518-35岁健康男性居民血清铁含量不会完全岁健康男性居民血清铁含量不会完全相同,而是呈现或大或小的相同,而是呈现或大或小的离散趋势离散趋势。平均数平均数:描述一组同质计量资料的集中趋势;反映一组观察值:描述一组同质计量资料的集中趋势;反映一组观察值的平均水平。的平均水平。常用的平均数有算术均数,几何均数和中位数。常用的平均数
11、有算术均数,几何均数和中位数。(一)算术均数(一)算术均数(mean)(mean):简称均数,总体均数用希腊字母:简称均数,总体均数用希腊字母表表示,样本均数用拉丁字母示,样本均数用拉丁字母 表示。表示。1.1.计算方法计算方法 1 1)直接法:适用于样本例数直接法:适用于样本例数n n较少的资料。较少的资料。其中其中X X1 1,X X2 2X Xn n为各变量值,为各变量值,n n为样本例数。为样本例数。XnXnX.XXXn21 一、描述集中趋势的统计指标一、描述集中趋势的统计指标2)加权法:适用于变量值较多的资料。加权法:适用于变量值较多的资料。f1,f2fn分别为各组段的频数,X1,X
12、2X0 为各组段的组中值,组中值=(本组段下限+下组段下限)/2。nfxffxX00 即频数多,权数大,作用也大,频数小,权数小,作即频数多,权数大,作用也大,频数小,权数小,作用也小。用也小。例例2-3测得测得8只正常大白鼠总酸性磷酸酶只正常大白鼠总酸性磷酸酶(TACP)含量()含量(U/L)为)为4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。试求其算术均数。试求其算术均数。L/U9075.38/38.3.08.243.62.4n/Xn/X.XXXn21 求例求例2-2中某地中某地120名正常成年男子的血清铁名正常成年男子的血清铁含量的均数。含量的均数。12
13、0名成年男子血清铁含量均数、标准差计算表(加权法)名成年男子血清铁含量均数、标准差计算表(加权法)组段组段频数(频数(f)组中值(组中值(X0)fX0(1)(2)(3)(4)=(2)(3)(5)=(3)(4)681012141618202224262830合计合计120(f)2228(fX0)43640()1368122027121084172766104180340513378276200108297911131517192123252729492437261352270057809747793863485000291684120fX20fXLmolffxX/57.18120222800X2
14、.均数的两个重要特性均数的两个重要特性 1).各离均差的总和等于各离均差的总和等于0。(总体中各变量值总体中各变量值X与均与均数之差称为离均差数之差称为离均差)2).离均差的平方和小于各观察值离均差的平方和小于各观察值X与任何数与任何数a之差的之差的平方和平方和。()即即设:a ,则a=d,d0 XX222ndXXaX222dXXdXXaX0222XXndXXdXX由于Xa 2 XX2aX3.均数的应用均数的应用但它最适用于但它最适用于对称分布资料对称分布资料,尤其是,尤其是。因为这时均数位于分布的中心,。因为这时均数位于分布的中心,最能反映资料的集中趋势。最能反映资料的集中趋势。(二)几何均
15、数二)几何均数(geometric mean):(几何均数也称为倍数均数,用(几何均数也称为倍数均数,用G表示)表示)1.几何均数的计算方法几何均数的计算方法 1)直接法:直接法:适用于样本例数n较少的资料。将n个观察值X1,X2,X3Xn的乘积开n次方对数形式:G=lg-1(lgX1+lgX2+lgX3+lgXn)/n=lg-1(lgX/n)nnXXXG.21例例2-57名慢性迁延性肝炎患者的名慢性迁延性肝炎患者的HBsAg滴度资滴度资料为料为1:16,1:32,1:32,1:64,1:64,1:128,1:512。求其平均效价。求其平均效价。7512lg.32lg32lg16lglglgl
16、g11nXG648062.1lg17份份HBsAg的平均滴度为的平均滴度为1:642)加权法:适用于样本例数加权法:适用于样本例数n较多的资料。较多的资料。n21nn22111f.ffXlgf.XlgfXlgflgGfXf lglg1X1,X2Xn为各组段的滴度或滴度倒数。为各组段的滴度或滴度倒数。f1,f2fn分别为各组段的频数。分别为各组段的频数。例例2-652例慢性迁延性肝炎患者的例慢性迁延性肝炎患者的HBsAg滴度滴度数据数据见表见表2-4,求其平均滴度求其平均滴度。74705.1197017.2lg52/06977.108lg527027.27.50515.1720412.12lgG
17、11 52例慢性肝炎患者的例慢性肝炎患者的HBsAg滴度的几何均数为滴度的几何均数为1:119.74705二)几何均数应用的注意事项:二)几何均数应用的注意事项:1)几何均数常用于)几何均数常用于等比级数资料等比级数资料或或对数对数正态分布资料正态分布资料。2)观察值中不能有)观察值中不能有0。3)观察值中不能同时有正值和负值。)观察值中不能同时有正值和负值。中位数(中位数(median,M):将一组变量值从小到大按顺序排列,将一组变量值从小到大按顺序排列,位次居中的那个变量值就是中位数。位次居中的那个变量值就是中位数。百分位数(百分位数(percentile,Px):指把数据从小到大排列后位
18、于指把数据从小到大排列后位于第第X%X%位置的数值。位置的数值。有n个观察值X1,X2Xn,把他们由小到大按顺序排列成X1X2X3Xn,将这n个观察值平均的平均的分为100等份,对应于每一等份的数值就是一个百分位数,对应于前面对应于前面X%个位个位置的数值称为第置的数值称为第X百分位数,用百分位数,用Px表示。表示。一个百分位数Px将总体或样本的全部观察值分为两部分,理论上,在不包括Px的全部数据中有X%的观察值比它小,有(100-X)%的观察值比它大。(三)中位数和百分位数(三)中位数和百分位数 1.中位数和百分位数的计算中位数和百分位数的计算 1)直接法:直接法:适用于样本例数n较少的资料
19、。将观察值按大小顺序排列,当n为奇数奇数时,中间那个数就是中位数。当n为偶数偶数时,中间两个数的平均数就是中位数。例例2-7某药厂观察某药厂观察9只小鼠口服高山红景天醇只小鼠口服高山红景天醇提物(提物(RSAE)后在乏氧条件下的生存时间(分钟)后在乏氧条件下的生存时间(分钟)如下:如下:49.1,60.8,63.3,63.6,63.6,65.6,65.8,68.6,69.0n为奇数,为奇数,M=63.6(cm)21nXM 2/XXM12n2n 2)频数表法计算中位数和百分位数:频数表法计算中位数和百分位数:适用于样本例数n较多的资料。累计频数累计频数:本组段的频数与以前各组段的频数:本组段的频
20、数与以前各组段的频数相加;相加;累计频率累计频率:每组段的累计频数除以总例数。:每组段的累计频数除以总例数。公式为公式为 L为百分位数所在组段的下限,i为该组段的组距,fx为该组段的频数,fL为百分位数所在组段的的累计频数,n为总例数。Lxxf100nXfiLP例2-8 利用表2-2的频数表求血清铁含量的中位数。组段组段频数频数累计频数累计频数累计频率累计频率681012141618202224262830合计合计120110.83343.336108.3381815.00123025.00205041.67277764.17189579.171210789.17811595.83411999
21、.171120100.00LmolfxnfiLPMLx/74.1850%5012027218%.50例例某市大气中某市大气中SO2的日平均浓度见表的日平均浓度见表2.5,求,求P25,P50,P75。例例某市大气中某市大气中SO2的日平均浓度见表的日平均浓度见表2.5,求中位数,求中位数,P25,P50,P75。350/17.104170%503616325100%.mgfxnfiLPMLx325/1.6939%25361672550%.mgfxnfiLPLx375/146233%753614525125%.mgfxnfiLPLx2.中位数和百分位数的应用中位数和百分位数的应用1)中位数常用于
22、描述)中位数常用于描述偏态分布资料偏态分布资料的集中趋势,反映位次的集中趋势,反映位次居中的观察值的平均水平。在对称分布的资料中,中位数和均居中的观察值的平均水平。在对称分布的资料中,中位数和均数在理论上是相同的。数在理论上是相同的。2)百分位数可用于确定医学参考值范围(详后)百分位数可用于确定医学参考值范围(详后)。3)分布在中部的百分位数相当稳定,具有较好的代表性,)分布在中部的百分位数相当稳定,具有较好的代表性,但靠近两端的百分位数,只有在样本例数足够多时才比较稳定。但靠近两端的百分位数,只有在样本例数足够多时才比较稳定。应用平均数的注意事项应用平均数的注意事项 1.平均数的计算和应用必
展开阅读全文