第二讲-卫生统计学-定量的统计描述[详版课资]课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第二讲-卫生统计学-定量的统计描述[详版课资]课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 详版课资 第二 卫生 统计学 定量 统计 描述 课件
- 资源描述:
-
1、第二讲第二讲 定量资料的统计描述定量资料的统计描述主要内容主要内容n频数与频数分布频数与频数分布n定量变量的特征数定量变量的特征数n常用统计图表常用统计图表1课堂优质一、离散型定量变量的频数分布一、离散型定量变量的频数分布二、连续型定量变量的频数分布二、连续型定量变量的频数分布第一节第一节 频数与频数分布频数与频数分布2课堂优质一、一、频数与频数分布频数与频数分布 频数:频数:对一个随机事件进行重复观察,其中某变量对一个随机事件进行重复观察,其中某变量值出现的次数被称作频数值出现的次数被称作频数(frequency)(frequency)某个测量某个测量值的个(例)数。值的个(例)数。(当汇总
2、大量的原始数据时,把数据按类型分组,其当汇总大量的原始数据时,把数据按类型分组,其中每个组的数据个数,称为该组的频数。中每个组的数据个数,称为该组的频数。)频数表(频数分布):频数表(频数分布):是用于反映各变量值及其相是用于反映各变量值及其相应频数之间的关系。(应频数之间的关系。(表示各组及它们对应的组频表示各组及它们对应的组频数的表格称为频数表或频数分布。)数的表格称为频数表或频数分布。)3课堂优质(一一)离散型定量变量的频数分布离散型定量变量的频数分布例例2-1 1998年某山区年某山区96名孕妇产前检查次数名孕妇产前检查次数资料如下:资料如下:0,3,2,0,1,5,6,3,2,4,1
3、,0,6,5,1,3,3,4,7等共等共96个个数值。数值。4课堂优质离散型定量变量的频数分布表离散型定量变量的频数分布表表2-1 1998年某地96名妇女产前检查次数分布检查次数频数频率(%)累计人数累计频率(%)(1)(2)(3)(4)(5)044.244.2177.31111.521111.52222.931313.53536.542627.16163.552324.08487.551212.596100.0合计96100表表2-1:96名妇女产前检查次数分布的频数分布表名妇女产前检查次数分布的频数分布表5课堂优质离散型定量变量的频数分布图离散型定量变量的频数分布图图 2-1 某 地 9
4、6名 妇 女 产 前 检 查 次 率 分 布0510152025300123455产 前 检 查 次 数频率(%)6课堂优质(二二)连续型定量变量的频数分布连续型定量变量的频数分布例例2-2 抽样调查某地抽样调查某地120名名18岁岁35岁健康男性居岁健康男性居民血清铁含量(民血清铁含量(mol/L)。)。将数据适当分组,计数每组的频数,根据这将数据适当分组,计数每组的频数,根据这些数据编制成的频数分布表(表些数据编制成的频数分布表(表2-2)则能显示出)则能显示出这组数据分布的特点。这组数据分布的特点。7课堂优质连续型定量变量的频数分布连续型定量变量的频数分布原始数据原始数据7.428.65
5、23.0221.6121.3121.469.9722.7314.9420.1821.6223.0720.388.4017.3229.6419.6921.6923.9017.4519.0820.5224.1423.7718.3623.0424.2224.1321.5311.0918.8918.2623.2917.6715.3818.6114.2717.4022.5517.5516.1017.9820.1321.0014.5619.8919.8217.4814.8918.3719.5017.0818.1226.0211.3413.8110.2515.9415.8318.5424.5219.2626
6、.1316.9918.8918.4620.8717.5113.1211.7517.4021.3617.1413.7712.5020.4020.3019.3823.1112.6723.0224.3625.6119.5314.7714.3724.7512.7317.2519.0916.7917.1919.3219.5919.1215.3121.7519.4715.5110.8627.8121.6516.3220.7522.1113.1717.5519.2612.6518.4819.8323.1219.2219.2216.7227.9011.7424.6614.1816.528课堂优质1、频数表的编
7、制、频数表的编制(1)求全距)求全距(R):R=最大值最大值 最小值最小值=29.64-7.42=22.22(mol/L)(2)确定组数、组距:)确定组数、组距:通常通常815组组 计算组距计算组距(i)i=R/组数组数 相邻两组段下限值之差称组距。一般都用等距,相邻两组段下限值之差称组距。一般都用等距,且用全距的十分之一进行估计。且用全距的十分之一进行估计。本例:本例:22.2210=2.222,取整为,取整为2,该样本可分为,该样本可分为12组。组。9课堂优质频数表的编制频数表的编制(3)确定组段:)确定组段:第一组段包括最小值,如本例为第一组段包括最小值,如本例为6.00;最后组段包括最
8、大值,如本例最后组段包括最大值,如本例28.0030.00(要求(要求第一个组段的下限应略小于最小值,最后通一组要同时第一个组段的下限应略小于最小值,最后通一组要同时写出上下限。)写出上下限。);尽量取较整齐的数值作为组段的端尽量取较整齐的数值作为组段的端点点;一般都用等距。一般都用等距。(4)列表划记:)列表划记:做出如表做出如表2-2的表格,将选好的组段顺的表格,将选好的组段顺序地列在序地列在(1)列。将原始数据按照列。将原始数据按照“下限下限x上限上限”的的原则确定每一例数据原则确定每一例数据x应归属的组段。依次完成(应归属的组段。依次完成(2)(5)列的清点频数、计算频率、累计频数与累
9、计频率)列的清点频数、计算频率、累计频数与累计频率等步骤,得如表等步骤,得如表2-1的频数表。的频数表。10课堂优质表表2-2 120名名18岁岁35岁健康男性居民血清铁含量(岁健康男性居民血清铁含量(mol/L)。)。组段(1)频数(2)频率(3)累计频数(4)累计频率(5)6.0010.8310.838.0032.5043.3310.0065.00108.3312.0086.671815.0014.001210.003025.0016.002016.675041.6718.002722.507764.1720.001815.009579.1722.001210.0010789.1724.0
10、086.6711595.8326.0043.3311999.1728.0030.0010.83120100.00合计12010011课堂优质2 2、频数分布图、频数分布图 在表在表2-2的基础上,可以绘制出图的基础上,可以绘制出图2-2,称为,称为直方图(频率直方图)。直方图(频率直方图)。横轴:横轴:血清铁含量血清铁含量纵轴:纵轴:频率密度,即频率频率密度,即频率/组距(直条面积等于组距(直条面积等于相应组段的频率)。相应组段的频率)。在组距相等时,直方图中矩形直条的高度与在组距相等时,直方图中矩形直条的高度与相应组段的频率成正比。相应组段的频率成正比。12课堂优质频数分布图频数分布图051
11、0152025306810 12 14 16 18 20 22 24 26 28血清铁(mol/L)频率密度13课堂优质1 1、正态分布:、正态分布:图形高峰在中央,两边对称图形高峰在中央,两边对称(或基本或基本对称对称)地逐渐减少,统计学上称之为地逐渐减少,统计学上称之为正态分布正态分布或或近近似正态分布。似正态分布。2 2、正偏态分布:、正偏态分布:高峰位于左侧高峰位于左侧,右侧的组段数多于右侧的组段数多于左侧,如图左侧,如图2-32-3。3 3、负偏态分布:、负偏态分布:高峰位于右侧高峰位于右侧,左侧的组段数多于左侧的组段数多于右侧,如图右侧,如图2-12-1。进行描述性统计时,需要根据
12、数值的分布形态进行描述性统计时,需要根据数值的分布形态选择统计指标和相应的计算公式。选择统计指标和相应的计算公式。3 3、频数分布的类型、频数分布的类型14课堂优质频数分布具有两个特征:频数分布具有两个特征:集中趋势集中趋势(central tendency):变量值集中位置。如变量值集中位置。如120名正常男子血清铁含量虽然高低不等,但向中间集名正常男子血清铁含量虽然高低不等,但向中间集中(中(18),中等的人数最多。),中等的人数最多。平均水平指标平均水平指标离散趋势离散趋势(tendency of dispersion):变量值围绕集中位变量值围绕集中位置的分布情况。本例置的分布情况。本
13、例1424,共有,共有89人,占人,占74.2;离离“中心中心”位置越远,频数越小;且围绕位置越远,频数越小;且围绕“中心中心”左左右对称。右对称。变异水平变异水平指标指标4 4、频数分布的特征、频数分布的特征15课堂优质5 5、频数表的主要用途、频数表的主要用途(1)揭示分布类型;)揭示分布类型;(2)便于发现特大值和特小值;)便于发现特大值和特小值;(3)计算集中趋势指标与离散趋势指标;)计算集中趋势指标与离散趋势指标;(4)作为陈述资料的形式,可以代替繁复的原始资料,便)作为陈述资料的形式,可以代替繁复的原始资料,便于进一步分析;于进一步分析;(5)当样本含量比较大时,可用各组段的频率作
14、为概率的)当样本含量比较大时,可用各组段的频率作为概率的估计值。如上述频数表估计值。如上述频数表(2)栏的频数除以总例数即为第栏的频数除以总例数即为第(3)栏栏的频率,由此可推测正常男子的血清铁含量出现在各组段的频率,由此可推测正常男子的血清铁含量出现在各组段的概率分别为的概率分别为0.0083、0.025、0.050、0.0083。16课堂优质一、算术平均数一、算术平均数二、几何均数二、几何均数 三、中位数与百分位数三、中位数与百分位数 四、众数四、众数 五、调合均数五、调合均数 第二节第二节 集中趋势指标集中趋势指标17课堂优质集中趋势指标集中趋势指标 平均指标又称平均数平均指标又称平均数
15、(average)(average),是一类用,是一类用于描述数值变量资料平均水平于描述数值变量资料平均水平(或集中趋势或集中趋势)的的指标。统计上的平均数一般包括指标。统计上的平均数一般包括5 5种,即种,即算术平算术平均数、几何平均数、中位数、众数以及调和均均数、几何平均数、中位数、众数以及调和均数数。在医学研究上对于连续型定量变量,较常。在医学研究上对于连续型定量变量,较常用的为用的为算术平均数、几何平均数和中位数算术平均数、几何平均数和中位数3 3种。种。18课堂优质一、算术均数(均数)一、算术均数(均数)n意义:意义:一组性质相同的观察值在数量上的平均一组性质相同的观察值在数量上的平
16、均水平。水平。(它是一组已知性质相同的数值之和除以它是一组已知性质相同的数值之和除以数值个数所得的商。)数值个数所得的商。)n表示:表示:(总体)、(总体)、(样本)(样本)n计算:计算:直接法、间接法、计算机直接法、间接法、计算机n特征:特征:估计误差之和为估计误差之和为0 0。n应用:应用:正态分布或近似正态分布正态分布或近似正态分布n注意:注意:合理分组,才能求均数,否则没有意义。合理分组,才能求均数,否则没有意义。X0)(XX19课堂优质(1 1)直接法:)直接法:当观察例数不多当观察例数不多(如样本含量如样本含量n n小于小于30)30)时,时,宜选择直接法。公式为:宜选择直接法。公
17、式为:nXnXXXxn2135)54321(nxx例题:有例题:有5 5个自然数分别为个自然数分别为1 1,2 2,3 3,4 4,5 5,求算术均数。,求算术均数。将将5 5个自然数代入公式,得:个自然数代入公式,得:计算:计算:20课堂优质例例2-3 测得测得8只正常大鼠血清总酸性磷酸酶(只正常大鼠血清总酸性磷酸酶(TACP)含量(含量(U/L)为)为4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。试求其算术均数。试求其算术均数。算术均数算术均数=(4.20+6.43+2.08+3.45+2.26+4.04+5.42+3.38)/8=3.9075(U/L)2
18、1课堂优质(2 2)加权法)加权法(weighted method)(weighted method):当观察例数很多可当观察例数很多可以用加权法计算。以用加权法计算。ffxfffxfxfxfxnnn212211例题:利用下表的资料,用加权法计算例题:利用下表的资料,用加权法计算120名成年名成年18岁岁35岁健康男性居民血清铁含量(岁健康男性居民血清铁含量(mol/L)算术均)算术均数,计算表如下:数,计算表如下:首先将数据编制成频数表,得出每组的频数,求出首先将数据编制成频数表,得出每组的频数,求出组中值,代入下列公式,得到均数。组中值,代入下列公式,得到均数。22课堂优质表2-3 加权法
19、计算均数组段组中值(X)ffX(1)(2)(3)(4)=(2)(3)6.007178.00932710.00 1166612.00 13810414.00 151218016.00 172034018.00 192751320.00 211837822.00 231227624.00 25820026.00 27410828.00 30.00 29129合计1202228LmolffXx/57.181202228直接法均数=18.61(mol/L)23课堂优质二、几何均数(geometric mean,G)nnxxxG21)lg(lg1nxG意义:意义:N N个数值的乘积开个数值的乘积开N N
20、次方即为这次方即为这N N 个数的几何均数。个数的几何均数。表示:表示:G G 计算:计算:应用:应用:当一组观察值不呈正态分布、且其差距较大时,用均数表示其当一组观察值不呈正态分布、且其差距较大时,用均数表示其平均水平会受少数特大或特小值影响;平均水平会受少数特大或特小值影响;数值按大小顺序排列后,各观察值呈倍数关系或近似倍数关系。数值按大小顺序排列后,各观察值呈倍数关系或近似倍数关系。如抗体的平均滴度、药物的平均效价等。如抗体的平均滴度、药物的平均效价等。(适用于观察值变化范围跨适用于观察值变化范围跨越多个数量级的资料越多个数量级的资料,其频数图一般呈正偏态分布。其频数图一般呈正偏态分布。
21、)计算几何均数的观察值不能小于或等于计算几何均数的观察值不能小于或等于0 0,因为无法求对数。,因为无法求对数。同一组数据的几何均数小于算术均数。同一组数据的几何均数小于算术均数。24课堂优质(1 1)直接法)直接法 当观察例数不多当观察例数不多(如样本含量如样本含量n n小于小于30)30)时采用直接法时采用直接法计算:计算:例题:例题:有有5份血清的抗体滴度分别为份血清的抗体滴度分别为1:10,1:100,1:1000,1:10000,1:100000,求平均抗体滴度。,求平均抗体滴度。将各抗体滴度的倒数代入公式,得:将各抗体滴度的倒数代入公式,得:10003lg)5100000lg10l
22、g(lg)lg(lg111nxG血清的抗体平均效价为血清的抗体平均效价为1 1:10001000。计算:计算:25课堂优质6451212864643232167G)log(log1nXG648062.1lg7512lg128lg64lg64lg32lg32lg16lglg11例例2-5 7名慢性迁延性肝炎患者的名慢性迁延性肝炎患者的HBsAg滴度资料为滴度资料为1:16,1:32,1:32,1:64,1:64,1:128,1:512。试。试计算其几何均数。计算其几何均数。26课堂优质(2)加权法)加权法 例例2-6 52例慢性肝炎患者的例慢性肝炎患者的HBsAg滴度滴度数据如表数据如表2-4。
23、试计算滴度的几何均数。试计算滴度的几何均数。)lg(lg)lglglg(lg12122111fXffffXfXfXfGnnn计算公式为:计算公式为:27课堂优质表2-4 52例慢性肝炎患者的HBsAg滴度资料抗体滴度频数(f)滴度倒数(X)lgXf(lgX)1:162161.204122.408241:327321.5051510.536051:6411641.8061819.867981:128131282.1072127.393731:256122562.4082428.898881:51275122.7092718.96489合计52108.0697774705.1195206977.1
展开阅读全文