医学统计学-第2章课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《医学统计学-第2章课件.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 统计学 课件
- 资源描述:
-
1、第二章 数值变量的描述性统计 统计图表;统计指标。第一节 频数分布一.编制频数表的步骤 求极差 R=84-57cm=27(次/分)划分组段 确定组数:较大样本时,一般取10组左右。确定组距:极差/组数=27/10=2.73(次/分)确定各组段的上下限:上限=下限+组距 统计各组段内的数据频数,编制频数表 表2.1 130名健康成年男子脉搏(次/分)的频数分布表脉搏组段 (1)频数(2)频率(%)(3)累计频数 (4)累计频率(%)(5)5659626568717477808385合计251215252619151011301.543.859.2311.5419.2320.0014.6211.5
2、47.690.7727193459851041191291301.545.3814.6226.1545.3865.3880.0091.5499.23100.00二.频数表的用途 可以揭示资料的分布类型和分布特征,以便于选用相应的统计分析方法。便于进一步计算指标和统计处理。便于发现某些特大或特小的可疑值。第二节 集中趋势的描述 三种平均数 算术均数 几何均数 中位数。(一)算术均数(x)简称均数,适合于表达呈正态分布资料的平均水平。直接法:X=X1+Xnn=Xn例2-2:X=81+70+66+6913=71.69(次/分)加权法 X=fXf例:X=572+605+6312+84 1130=71.
3、12(次/分)(二)几何均数(G)适用于原始数据分布不对称,但经对数转换后呈对称分布的资料。G=n X1X2Xn G=lg-1()lgXn G=lg-1()f lgXf例:40名麻疹易感儿童接种麻疹疫苗后一个月,测其血凝抑制抗体滴度,结果如表所示,求几何均数。抗体滴度人数 f滴度倒数 XlgX1:41:81:161:321:641:1281:2561:512145811641481632641282565120.60210.90311.20411.50511.80612.10722.40822.7093G=lg-1(f lgXn)=lg-1(1 0.6021+4 0.9031+1 2.7093
4、)40=lg-1(4067.1282)=48G=1:48(三)中位数(M)适合于表达偏态资料、或分布不明的资料的平均水平,尤其适合于表达只知数据的个数、但部分较大或较小数据的具体数值未准确知道的资料的平均水平。对于原始数据和频数分布表资料,分别用下列两式计算中位数。M=(X n/2+X(n/2+1)/2 (n为偶数)X(n+1)/2(n为奇数)M=LM+iMfM(n2 fL)其中,LM:中位数所在组下限;iM:中位数所在组的组距;fM:中位数所在组的频数;fL:中位数所在组前一组的累计频数。2例2-4 表2.3 107正常人的尿铅含量(g/L)的中位数计算表含量(g/L)(1)频数f(2)累计
5、频数 f (3)累计频率%(4)0481216202428合计1422291815612107143665839810410510713.0833.6460.7577.5791.5997.2098.13100.00M=8+(107/2-36)=10.41(g/L)429第三节 离散程度的描述 例:设有三组同年龄、同性别儿童体重(kg)数据如下:甲组 26 28 30 32 34 乙组 24 27 30 33 36 丙组 26 29 30 31 34 描述离散程度的指标:极差、四分位数间距、方差、标准差及变异系数。一.极差(全距,R)为一组同质观察值中最大值与最小值之差。甲组 R=34-26=8
6、 乙组 R=36-24=12 甲组数据分布较乙组集中。优点:计算简单缺点:1.没有充分利用样本信息,只考虑最大值与最小值之差异,不能反映组内其它观察值的变异度。2.样本含量越大,抽到较大或较小观察值的可能性越大,则极差可能越大,因此,样本含量悬殊时不宜用极差比较分布的离散度。所以,一般不用极差来反映离散程度。二.四分位数间距(Q)1.分位数的概念分位数是一种位置指标,一个特定的分位数将任何一个频数曲线下的面积分为两部分。第1四分位数记作Q1,第2、第3四分位数,分别记作Q2、Q3;第1百分位数,记作P1。同理,还有第2、第3、第99百分位数,分别记作P2、P3、P99。显然,Q1=P25、Q2
7、=P50=M、Q3=P752.百分位数的计算公式对连续型变量频数表资料,按下式计算第X百分位数PX:PX=LX+iXfX(nX%fL)其中,LX:第X百分位数所在组下限;iX:第X百分位数所在组的组距;fX:第X百分位数所在组的频数;fL:第X百分位数所在组前一组的累计频数。例 某地200例正常成人血铅含量的频数分布如表所示,请计算出血铅含量的95%正常值范围。200例正常成人血铅含量的频数分布表 血铅含量 频数 累计频数 (mol/L)(1)(2)00.240.480.720.971.211.451.691.932.172.422.662.903.1464843362813144412016
8、5497133161174188192196197199199200解:即求P95。nX%=20095%=190P95=1.69+(190-188)0.24 4=1.81(mol/L)故某地正常人血铅含量95%的单侧正常值范围的上限为 1.81(mol/L)。3.四分位数间距(Q)Q=P75-P25Q=QU-QL优缺点:用四分位数间距作为描述数据分布离散程度的指标,比极差稳定,但仍未考虑到每个数据的大小,常用于描述偏态频数分布以及分布的一端或两端无确切数值资料的离散程度。例2-10 据书中表2.3资料求四分位数间距Q。P25=4+4 22(107 25%14)=6.32(g/L)P75=12+
9、418(107 75%65)=15.39(g/L)Q=P75-P25=15.39-6.32=9.07(g/L)三.方差2=(X-)2NS2=(X-X)2n-1 n-1称为自由度四.标准差 =(X-)2NS=(X-X)2n-1直接法;s=X2-(X)2/n由于(X-X)2=X2-(X)2/n,所以n-1加权法:s=fX2-(fX)2/ff-1例2-12 求书中表2.2数据的标准差。解 f=130 fX=9246 fX2=662076 S=662076-92462/130130-1=5.89(次/分)五.变异系数(CV)CV=SX100%1.用于比较度量衡单位不同的多组资料的变异度。2.比较均数相
展开阅读全文