常用医学统计分析方法的基本知识课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《常用医学统计分析方法的基本知识课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 常用 医学 统计分析 方法 基本知识 课件
- 资源描述:
-
1、2022-7-412022-7-42一一. . 统计学应用中的常见误区统计学应用中的常见误区2022-7-43问题1:统计学是数字游戏? 数字形式仅是表面现象。几个示例 统计学(Statistics):是一门研究数据的搜集、整理、是一门研究数据的搜集、整理、分析的科学。更主要的是分析的科学。更主要的是帮助人类探索未知事物帮助人类探索未知事物规律的工具规律的工具。 统计学存在的必要性统计学存在的必要性?2022-7-44几个例子 2003年湖南省省级计划生育工作的人员总数; 2003年在湘雅医院出生的新生儿的平均体重; 2003年中国艾滋病发病率; 湖南省65岁以上人群的平均血压;返回2022-
2、7-45三个原因 人类要了解未知事物的特点或规律人类要了解未知事物的特点或规律;如SARS的病因研究,一些恶性肿瘤的治疗方法探索,一些疾病的预防等等; 差异或变异在研究总体中存在的普遍性差异或变异在研究总体中存在的普遍性;如全国正常人群的体重、身高、血压测量值等等。数据的表达或描述的难度。 人、财、物的限制,不能够调查或检查总体中人、财、物的限制,不能够调查或检查总体中所有的观察单位,代价太大所有的观察单位,代价太大。2022-7-46留给统计学的问题 如何简洁地、准确地从一大批杂乱无章的数据中提炼出代表性信息?(统计描述) 如何合理地由样本的信息(部分信息)推断总体的信息(总体信息)?(统计
3、推断)2022-7-47统计方法的主要应用1.通过种种手段以最合适的方法搜集数据。2.采用统计指标、统计表、统计图描述数据的规律。3.采用合适的统计方法对数据进行分析,对整个研究的结果下结论。2022-7-48问题2:数据被恰当地表达了吗?1. 统计指标的使用准确吗? 还是 ?各自使用的条件是什么? 是万用通行证吗?率与构成比 搞清楚了吗?如此计算率合适吗 ?2. 统计表正确吗?3. 统计图正确吗?XXSXSXS2022-7-492022-7-410集中趋势的描述集中趋势的描述平均数平均数:描述一组变量值的集中位置或平均水平的指标体系。1. (算术)均数:对称分布,尤其是正态分布;2. 几何均
4、数:对数转换后呈对称分布,尤其是对数正态分布;3. 中位数 :一般偏态分布;2022-7-411离散趋势描述离散趋势描述:描述一组变量值的离散趋势或变异程度的指标体系。1.极差:任何计量资料,是参考变异指标2. 四分位数间距:与中位数配套用3. 标准差 :与算术均数配套用4. 变异系数 :描述对称分布(特别是正态分布)资料的相对变异程度。2022-7-412示例1:率和构成比的区分2022-7-413 示例2: 如某种疗法治疗5例病人5例全部治愈,则计算治愈率为5/5100% =100%,若4例治愈,则治愈率为4/5100% =80%,由100%至80%波动幅度较大,但实际上只有1例的变化。
5、2022-7-414表10-3 不同心理分值的冠心病危险因素水平比较 2022-7-415统计图的误导作用 直条图的纵轴尺度起点必须为零示意图2022-7-416问题3:t检验、卡方检验是万能的吗? 正态分布、方差齐性的条件满足了吗? 是t检验还是方差分析; 是t检验还是U检验? 是成组t检验还是配对t检验? 是t检验,还是校正t检验,或者是非参数检验? 对于计数资料,是通常的卡方检验,还是Yates校正检验,或是精确概率检验? 是配对设计,还是成组设计的四格表资料?2022-7-417误区4:统计检验决定论与统计无用论 P值一定要小于0.05或者0.01才行吗? P值的决定因素您考虑了哪几个
6、? 统计检验判断结果与专业判断结果相比,哪个更重要?2022-7-418 2022-7-419计量资料的常用统计指标计量资料的常用统计指标 描述集中趋势的特征数(描述集中趋势的特征数(选代表选代表) 描述离散趋势的特征数(描述离散趋势的特征数(代表程度代表程度) 目的:简单、明了传达信息目的:简单、明了传达信息2022-7-420表表 某地某地150名正常成年男子红细胞数(名正常成年男子红细胞数(1012/L) 编号编号红细胞数红细胞数编号编号红细胞数红细胞数1 13.983.982 24.544.541431434.674.673 34.744.741441445.405.404 45.13
7、5.131451455.295.295 54.434.431461464.774.776 64.814.811471475.385.387 74.984.981481485.155.158 83.793.791491494.644.641501505.195.19问题:谁能一眼看出下述数据的分布规律?2022-7-421一、一、描述集中趋势的特征数(描述集中趋势的特征数(平均指标)平均指标)总称为平均数(average)反映了资料的集中趋势( central tendency )。常用的有:1. 算术均数(arithmetic mean),简称均数 (mean)2. 几何均数(geometri
8、c mean)3. 中位数 (median)1.1. 算术均数(算术均数(meanmean)nXnXXXXn21112233123kkikif Xf Xf Xf XfXXfffffX符号:总体 样本适用条件:资料呈对称分布,尤其是正态或近似正态。计算:(1)直接法(2)频数表法2022-7-4232. 2. 几何均数(几何均数(geometric meangeometric mean)nXXnXXXXnXXXXXGnGnnGlglglg)lglg(lg1lg12121适用条件:呈倍数关系的等比资料或对数正态分布(正偏态)资料;如抗体滴度资料。2022-7-424几何均数的示例几何均数的示例血清
9、的抗体效价滴度的倒数倒数分别为:10、100、1000、10000、100000,求几何均数。1000510lg10lg10lg10lg10lglg543211G此例的算术均数为22222问题:描述此类型资料集中趋势时,为什么倾向选用几何均数?2022-7-425频数表资料的几何均数频数表资料的几何均数inniiifXfXfXffXfGlglglglglglg221111抗体滴度抗体滴度 人数人数, f 滴度倒数滴度倒数, X lgX flgX 1:41:81:161:321:512 合计合计15625724816325120.60210.90311.20411.50512.70930.602
10、14.51557.22463.010213.5465 72.2471 2022-7-4263. 3. 中位数(中位数(medianmedian) 定义:是将一批数据从小至大排列后位次居中的数据值,反映一批观察值在位次上的平均水平。 符号:Md/M 适用条件:适合各种类型的资料。尤其适合于大样本偏态分布的资料; 资料有不确定数值;资料分布不明等。 2022-7-427中位数计算公式中位数计算公式先将观察值按从小到大顺序排列,按以下公式计算:为偶数为奇数nxxnxMdnnn22/12/2/ ) 1(注意:公式中n的含义,数据自小到大排序后的编号。2022-7-428频数表资料的中位数频数表资料的中
11、位数mLffniLMdnMd)%50()%50(值间的频数所在组段下限值至上限至该下限值的累计频数组距所在组段下限值下限值下限值L上限值上限值Ui; fm中位数中位数Md)%50(Lfn2022-7-429潜伏期潜伏期/h(1) 频数,频数,f(2) 累计频数累计频数 f所占百分比所占百分比(3)0171212646434312387070183292922469696300969636499994248 合计合计2100100145例4-8中位数12+6x(145x50%63)/3813.5(h)2022-7-430小结: 集中趋势的描述平均数 平均数:描述一组变量值的集中位置或平均水平的指
12、标体系。 不同的分布使用不同的指标 算术)均数:正态或近似正态分布的资料 几何均数:对数正态分布或等比级数资料 中位数 :一般偏态分布2022-7-431离散趋势的特征数离散趋势的特征数常用指标有: 1. 极差或全距(Range) 2. 四分位数间距(Quartile range) 3. 方差 (Variance) 4. 标准差(Standard Deviation) 5. 变异系数 (Coefficient of Variation)考试要点:表示符号、定义、适用条件、区别2022-7-432 盘编号盘编号 甲甲乙乙丙丙1 14404804902 24604904953 3500500500
13、4 45405105055 5560520510合计合计250025002500250025002500均数均数500500500500500500例:设甲、乙、丙三人,采每人的耳垂血,然后红细胞计数,每人数5个计数盘,得结果如下(万/mm3)甲乙丙2022-7-4331.1.极差极差(Range(Range) ( (全距全距) )minmaxXXR 符号:R意义:反映全部变量值的变动范围。 优点:简便缺点:只利用了两个观测值适用范围:任何计量资料2022-7-4342. 2. 四分位数间距四分位数间距百分位数百分位数 :数据从:数据从小到大小到大 排列排列; ;在百分在百分尺度下,所占百分比
14、尺度下,所占百分比对应的值。记为对应的值。记为P Px x。 四分位间距四分位间距:Q QP P7575 P P2525 P100(max)P75P50(中位数中位数)P25P0(min)Px2022-7-435频数表资料的百分位数频数表资料的百分位数mLxxffxniLPxnP)%()%(值间的频数所在组段下限值至上限至该下限值的累计频数组距所在组段下限值下限值下限值L上限值上限值Ui; fm百分位数百分位数Px)%(Lfxn2022-7-436P256+6x(145x25%17)/468.51(h)P7518+6x(145x75%101)/3219.45(h)Q19.45-8.5110.9
15、4(h)潜伏期潜伏期/h(1) 频数,频数,f(2) 累计频数累计频数 f所占百分比所占百分比(3)0171212646434312387070183292922469696300969636499994248 合计合计21001001452022-7-437百分位数的应用百分位数的应用可用多个百分位数可用多个百分位数描述计量资料的分布特征描述计量资料的分布特征2022-7-4383.3.方差方差方差 (variance)也称均方差(mean square deviation),样本观察值的离均差平方和的均值,表示一组数据的平均离散情况。222(sum of square)(- )(- )xx
16、SSlXXN离均差平方和总体方差11)(2222nnXXnXXS样本方差2022-7-439方差的优点和缺点方差的优点和缺点优点:利用了所有的观测数值。缺点:容易受极大值或极小值的影响;单位与原观测单位不一致。2022-7-4404.4.标准差标准差222()11XXnXXSnn样本标准差标准差 (standard deviation)即方差的正平方根;其单位与原变量X的单位相同。122fffXfXS频数表样本标准差2()XXN总体标准差2022-7-441标准差的计算标准差的计算盘编号盘编号 甲甲乙乙丙丙甲甲2 2乙乙2 2丙丙2 21 144048049019360023040024010
17、02 24604904952116002401002450253 35005005002500002500002500004 45405105052916002601002550255 5560520510313600270400260100合计合计250025002500250025002500 126040012510001250250标准差标准差50.9915.817.9199.50155/250012604001222甲的标准差nnXXS2022-7-4425.变异系数变异系数(coefficient of variation)%100XSCV适用条件适用条件: 观察指标单位不同,如身
18、高、体重观察指标单位不同,如身高、体重 同单位资料,但均数相差悬殊同单位资料,但均数相差悬殊均数均数 标准差标准差变异系数变异系数青年男子青年男子 身高身高170 cm170 cm6 cm6 cm3.53.5体重体重60 kg60 kg7 kg7 kg11.711.7 意义:意义:挑选指标时变异系数越小,指标越好。 2022-7-443变异指标小结变异指标小结1极差较粗,适合于任何分布2标准差与均数的单位相同,适合于近似正态分布3变异系数主要用于单位不同或均数相差悬殊资料4平均指标和变异指标分别反映资料的不同特征, 组合使用 如 正态分布:均数、标准差; 偏态分布:中位数、四分位半间距2022
19、-7-4442022-7-445计数资料的计数资料的常用统计指标常用统计指标一、计数资料的数据整理一、计数资料的数据整理二、二、常用相对数指标常用相对数指标三、三、应用注意事项应用注意事项2022-7-446一、计数资料的数据整理一、计数资料的数据整理计数资料/分类资料/定性资料:按某种属性分类,然后清点每类的例数。住院号年龄职业文化程度分娩方式妊娠结局202565527无中学顺产足月202565322无小学助产足月202583025管理人员大学顺产足月202567724知识分子中学顺产早产202564730管理人员大学顺产足月202584832无小学剖宫产足月201991527无中学顺产死产
展开阅读全文