医学统计学重点总结课件-2.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《医学统计学重点总结课件-2.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 统计学 重点 总结 课件 _2
- 资源描述:
-
1、医学统计学综合练习三类资料(1)定量资料(quantitative data)以定量值表达每个观察单位的某项观察指标,如血脂、心率等。特点:各观察单位间只有量的差别;数据间有连续性。三类资料(2)定性资料(qualitative data)以定性方式表达每个观察单位的某项观察指标,如血型、性别等。特点:各观察单位间或者相同,或者存在质的差别;有质的差别者之间无连续性。三类资料(3)等级资料(ranked data,ordinal data)以等级表达每个观察单位的某项观察指标,如疗效分级、心功能分级等。特点:各观察单位间或者相同,或者存在质的差别;各等级间只有顺序,而无数值大小,故等级之间不可
2、度量。定量资料的描述 集中趋势:算术均数 几何均数 中位数 百分位数 离散趋势:极差 四分位数间距 标准差、方差 变异系数集中趋势指标应用注意事项 算数均数:适用于单峰对称分布资料;几何均数:适合于作对数变换后单峰对称分布资料;中位数和百分位数:适用于任何分布的资料;中位数和百分位数在样本含量较少时不稳定,越靠两端越不稳定;中位数在抗极端值的影响方面,比均数具有较好的稳定性,但不如均数精确。因此,当资料适合计算均数或几何均数时,不宜用中位数表示其平均水平。不同质的资料应考虑分别计算平均数。6离散趋势指标应用注意事项 全距:反映资料的分布范围,全距大说明数据的变异度大,适用于任何资料;四分位间距
3、:两个特定的百分位数,常用于描述不对称资料的特征;方差和标准差:常用来描述正态分布的资料;变异系数:常用于比较度量衡单位不同的两组或多组资料 的变异度;比较均数相差悬殊的两组或多组资料的变异度。7正态分布 Normal distribution 德国数学家Gauss发现 最早用于物理学、天文学 Gaussian distribution正态分布的特征 正态分布有两个参数(parameter),即位置参数(均数)和变异度参数(标准差)。高峰在均数处;均数两侧完全对称。正态曲线下的面积分布有一定的规律。正态分布和标准正态分布曲线下面积分布规律总结正态分布标准正态分布面积(或概率)-1.64+1.6
4、4-1.64+1.6490.00%-1.96+1.96-1.96+1.9695.00%-2.58+2.58-2.58+2.5899.00%正态分布的应用 估计频数分布 质量控制 确定临床参考值范围参考值范围的估计方法方法双侧 单侧下限单侧上限正态分布法Xus/2 Xu s Xu s 参考值范围(reference interval)(reference interval)参考值范围又称正常值范围(normal range)。什么是参考值范围:是绝大多数正常人的某观察指标所在的范围。绝大多数:90%,95%,99%等等。确定参考值范围的意义:用于判断正常与异常。“正常人”的定义:排除了影响所研究
5、的指标的疾病和有关因素的同质的人群。由抽样引起的样本统计量与总体参数间的差别。原因:个体变异抽样 表现:样本统计量与总体参数间的差别不同样本统计量间的差别 抽样误差是有规律的!抽样误差(sampling error)中心极限定理p 从正态总体中随机抽样,样本均数服从正态分布;p 从偏态分布的总体中随机抽样,当样本含量足够大时,样本均数也近似服从正态分布。从任意分布的总体从任意分布的总体(均数均数,标准差,标准差)中随机抽样,当样本含量逐渐增大时,中随机抽样,当样本含量逐渐增大时,样本均数的分布趋向正态分布,样本均数的分布趋向正态分布,此分布的均数为此分布的均数为 ,标准差为,标准差为 标准误(
6、standard error)(standard error)样本统计量的标准差称为标准误。样本均数的标准差称为均数的标准误。均数的标准误表示样本均数的变异度。当总体标准差未知时,用样本方差代替,前者称为理论标准误,后者称为样本标准误。xn xssn标准误与标准差(1)联系:都表示变异的大小;样本含量一定时,标准差越大,标准误越大。nSSX/标准误与标准差(2)标准差 含义:一组变量值离散程度;标准差越小,均数的代表性越好;应用:估计参考值范围;与n的关系:样本含量越大,标准差越稳定,n 很大时,标准差趋向于总体标准差。标准误与标准差(3)标准误含义:样本统计量的离散程度;标准误越小,用样本均
7、数来反映总体均数越可靠;应用:计算可信区间;与n的关系:样本含量越大,均数的标准误越小,n很大时,标准误趋向于0。统计推断(statistical inference)根据样本所提供的信息,以一定的概率推断总体的性质。u 总体参数的估计 (parameter estimation)u 假设检验 (hypothesis test)区间估计(interval estimation)按一定的概率或可信度(1-)用一个区间估计总体参数所在范围,这个范围称作可信度为1-的可信区间。这种估计方法称为区间估计。理论基础:抽样分布规律假设检验的步骤:u建立假设(在假设的前提下有规律可循);u确定检验水准(确定
8、最大允许误差);u计算检验统计量(样本与总体有多大的偏离);u计算概率P(该样本是否支持零假设);u结论(根据小概率原理)。均数的假设检验p样本均数与总体均数的比较p配对设计样本均数的比较p两样本均数的比较均数的假设检验应用条件p独立性、正态性、方差齐性独立性、正态性、方差齐性 方差齐性检验 方差不齐时的近似 t 检验 大样本时,均数比较的 u 检验I 型错误和 II 型错误实际情况假设检验的结果拒绝 H0 不拒绝 H0 H0 成立I 型错误()H0 不成立把握度(1-)II 型错误()P值的意义 从 H0 总体中随机获得等于或大于现有统计量值的概率。拒绝H0时所冒的风险。界值界值tt定性资料
9、 定性资料的特点 离散性,变量仅取有限的几个值;资料不含有次序的信息;举例 血型(A、B、O、AB)人群中某病发生与否(发生、不发生)描述指标:率 相对数 构成比 相对比常用相对数(1)率(rate),又称频率指标,说明某现象发生的频率和强度。(强度相对数)实际发生某现象的观察单位数率比例基数可能发生某现象的观察单位总数常用相对数(2)构成比(proportion),又称构成指标,说明一种事物内部各组成部分所占的比重或分布。各部分构成比之和为1或100%100观察单位总数同一事物各组成部分的位数某一组成部分的观察单构成比常用相对数(3)比(ratio),又称相对比,是A,B两个有关指标之比,说
10、明A为B的若干倍或百分之几。两个指标可以性质相同,也可以不同。BA比四格表(fourfold table)的概念 这四个格子的频数是整个表的基本数据,其余数据都是从这四个基本数据推算出来的,这种资料称为四格表资料。abcd2检验的基本思想 如果H0假设成立,则实际频数(actual frequency)与理论频数应该比较接近。如果实际频数与理论频数相差较大,超出了抽样误差所能解释的范围,则可以认为H0假设不成立,即两样本对应的总体率不等。理论频数的计算RCRCn nTN4310534016568326109 实际数 理论频数40.3612.6442.6411.36T11=53 83/109=4
展开阅读全文