常用卫生统计学方法课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《常用卫生统计学方法课件.pptx》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 常用 卫生 统计学 方法 课件
- 资源描述:
-
1、01卫生统计学概述卫生统计学概述2022-4-18CONTENTS1. 基本概念2. 基本步骤2022-4-18变量值变量值观察值观察值定性定性定量定量一、卫生统计学的基本概念变量:变量:对每个观察单位的某项特征进行测定和观察,对每个观察单位的某项特征进行测定和观察,这种观察单位的特征称为变量。这种观察单位的特征称为变量。2022-4-180101计量资料用度量衡的方法测量每个观察单位的某用度量衡的方法测量每个观察单位的某项研究指标量的大小,所得的数据称为项研究指标量的大小,所得的数据称为数值变量。数值变量。0202计数资料将全体观察单位按某种性质或类别进行分组,将全体观察单位按某种性质或类别
2、进行分组,然后清点各组中的例数,这样得到的数据称为然后清点各组中的例数,这样得到的数据称为计数资料,亦称为分类变量计数资料,亦称为分类变量。0303等级资料将全体观察单位按某种性质的不同程度分为若干将全体观察单位按某种性质的不同程度分为若干组,分别清点各组中的例数,这种数据资料称为组,分别清点各组中的例数,这种数据资料称为等级资料等级资料。统计资料统计资料一、卫生统计学的基本概念描述计量资料常用统计方法:平均数、标准差等;描述计量资料常用统计方法:平均数、标准差等; 统计分析方法:统计分析方法:u u检验、检验、t t检验、方差分析等。检验、方差分析等。计数资料常用统计指标:率、构成比等;计数
3、资料常用统计指标:率、构成比等;统计分析方法:统计分析方法:u u检验、检验、2检验等。检验等。计数资料常用统计指标:率、构成比等;计数资料常用统计指标:率、构成比等;统计分析方法:秩和检验、统计分析方法:秩和检验、2检验等。检验等。2022-4-18是从总体中随机抽取有代表性的一部分观察单位,是从总体中随机抽取有代表性的一部分观察单位,用样本信息去推断总体特征。用样本信息去推断总体特征。样本根据研究目的确定的同质的观察单位根据研究目的确定的同质的观察单位的某个变量值的全体。的某个变量值的全体。总体一、卫生统计学的基本概念2022-4-18特点:不可避免,但可特点:不可避免,但可控制在一定范围
4、。控制在一定范围。即使消除了系统误差,控制即使消除了系统误差,控制了随机测量误差,样本统计了随机测量误差,样本统计量和总体参数之间仍存在差量和总体参数之间仍存在差别,这种由随机抽样引起的别,这种由随机抽样引起的样本指标与总体指标的差异样本指标与总体指标的差异由于某种必然因素所致,由于某种必然因素所致,具有一定的方向性。具有一定的方向性。偶然机遇所致,无方向性,对同偶然机遇所致,无方向性,对同一样品多次测定,结果有高有低。一样品多次测定,结果有高有低。抽样误差抽样误差系统误差系统误差误差误差2022-4-18一、卫生统计学的基本概念特点:不是偶然造成,观特点:不是偶然造成,观察结果一贯性的偏高或
5、偏察结果一贯性的偏高或偏低。低。避免方法:避免方法:1 1)通过周密的研究设计)通过周密的研究设计2 2)调查或测量过程中的)调查或测量过程中的质量控制质量控制随机测量误差随机测量误差特点:由于个体变异造成,抽样特点:由于个体变异造成,抽样机遇所致。客观存在,不可避免。机遇所致。客观存在,不可避免。但可估计大小,也可增加样本含但可估计大小,也可增加样本含量使其减小。量使其减小。是指一次试验结果计算得到的样本率。是指一次试验结果计算得到的样本率。频率(样本)描述随机事件发生的可能性大小的数值。事件描述随机事件发生的可能性大小的数值。事件A A的的概率记为概率记为P(A),P(A),随机事件的概率
6、随机事件的概率P P取值在取值在0 01 1之间。之间。概率(总体)一、卫生统计学的基本概念02计量资料的统计描述计量资料的统计描述2022-4-18 均数均数常用平均数常用平均数 几何均数几何均数 中位数中位数 平均数平均数(average)常用于描述一组变量常用于描述一组变量值的集中趋势,是反映同质资料的平均水值的集中趋势,是反映同质资料的平均水平或集中位置的特征值。平或集中位置的特征值。2022-4-18 1. 均数均数 (算术均数算术均数) (mean)表示符号表示符号总体均数总体均数 ()样本均数样本均数 (x )应应 用用对称分布资料,尤其是正态分布资料对称分布资料,尤其是正态分布
7、资料计算方法计算方法 x1+ x2+ xn x直接法直接法 x= = n nf 1x1 + f 2x2 + +f kxk fx加权法加权法 x= = f 1 +f 2+f k n2022-4-18 2. 几何均数几何均数 (geometric mean)表示符号表示符号(G)应应 用用 对数正态分布资料,变量值呈倍数关系对数正态分布资料,变量值呈倍数关系计算方法计算方法直接法直接法 G = n x1 x2 xn lgx1+lgx2+lgxn lgx G = lg1 = lg1 n n f1lgx1+f2lgx2+fklgxk f lgx加权法加权法G = lg1 = lg1 n n2022-4
8、-18 3. 中位数中位数 (median)表示符号表示符号(M)偏态分布资料偏态分布资料应应 用用变量值分布一端或两端无确定数值变量值分布一端或两端无确定数值分布不明资料分布不明资料计算方法计算方法 直接用变量值计算直接用变量值计算M = X n+1 (n为奇数时为奇数时) 2 1 或或M= X n + X n (n为偶数时为偶数时) 2 2 2+12022-4-18 描述变量值的离散趋势用描述变量值的离散趋势用变异指标变异指标 全距全距 常用变异指标常用变异指标 四分位数间距四分位数间距方差和标准差方差和标准差 变异系数变异系数2022-4-18 1. 全距全距 (range, 简记为简记
9、为R) R = 最大值最大值 最小值最小值反映变量值的变异范围反映变量值的变异范围各种类型资料都可应用,但只作各种类型资料都可应用,但只作 参考资料参考资料2022-4-18 2. 方差方差 和和 标准差标准差(standard deviation) 定义公式定义公式 ( X ) 2 (X ) 2 2 = = N N ( X X) 2 ( X X) 2 S2 = S = n 1 n 1 2022-4-18应用公式应用公式 X2 ( X ) 2 / n直接法直接法S = n 1 f X2 ( f X) 2 / n加权法加权法S = n 12022-4-18 标准差用途:标准差用途: 1. 表示同
10、质变量值的离散程度;表示同质变量值的离散程度; 2. 在多组资料均数相近、度量单位相同的条件下在多组资料均数相近、度量单位相同的条件下表示观察值的变异度大小;表示观察值的变异度大小; 3. 与均数结合描述正态分布的特征和估计医学参与均数结合描述正态分布的特征和估计医学参考值范围;考值范围; 4. 与样本含量与样本含量(n)结合,计算标准误结合,计算标准误2022-4-18用途:用途:1) 比较多组比较多组单位不同单位不同资料的变异度资料的变异度2)比较多组)比较多组均数相差较大均数相差较大资料的变度资料的变度3. 变异系数变异系数 (coefficient of variation, 简记为简
11、记为CV) 定义定义 CV = s / X100%2022-4-18 (三三 正态分布的概念和特征正态分布的概念和特征 正态分布是以均数为中心呈对称的钟型分布正态分布是以均数为中心呈对称的钟型分布 频数(人数) 125 129 133 137 141 145 149 153 157 161身高 (cm)f 120名12岁健康男孩身高的频数分布Normal distribution curve2022-4-18 正态分布的特征有:正态分布的特征有:1) 正态分布曲线在均数处最高正态分布曲线在均数处最高2) 正态分布以均数为中心,左右对称且逐渐减少正态分布以均数为中心,左右对称且逐渐减少3) 正态
12、分布曲线的两个参数正态分布曲线的两个参数和和, 记作记作N (, 2)4) 正态曲线在正态曲线在1处各有一个拐点处各有一个拐点2022-4-18 正态曲线下的面积分布规律正态曲线下的面积分布规律 1 占正态曲线下面积的占正态曲线下面积的 68.27% 1.96 占正态曲线下面积的占正态曲线下面积的 95.00% 2.58 占正态曲线下面积的占正态曲线下面积的 99.00% 若若n100,则,则可用可用 X 代替,代替,用用 s 代替。代替。 - -2.58 -1.96 -1 +1 +1.96 +2.582.5%0.5%2022-4-18 正态分布的应用正态分布的应用1. 估计变量值的频数分布估
13、计变量值的频数分布2. 制定医学临床参考值制定医学临床参考值常常 用用 U 值值 表表- 正常值范围正常值范围 双侧双侧 单侧单侧- 90 % 1.645 1.282 95 % 1.960 1.645 99 % 2.576 2.326-95% 双侧参考值双侧参考值: 1.96S99% 双侧参考值双侧参考值: 2.58S 95% 单侧参考值单侧参考值: - 1.64S , P5 或或 0.05 (来自同一总体)(来自同一总体) ? 假设检验回答假设检验回答 环境条件影响环境条件影响 P 0 或或 0 (单侧检验)(单侧检验) (检验水准检验水准) :通常取:通常取 =0.052022-4-182
14、) 选定检验方法,计算检验统计量选定检验方法,计算检验统计量 根据资料类型及统计推断的目的选用合适根据资料类型及统计推断的目的选用合适的检验方法计算出统计量的检验方法计算出统计量( t值、值、u值、值、 2值等值等 )。3) 确定确定P值值 ,作出推断结论作出推断结论 根据自由度,查不同统计量的界值表根据自由度,查不同统计量的界值表( t值值表、表、 2值表等值表等),确定现有统计量的概率,确定现有统计量的概率P值值 2022-4-18 确定确定P值值 : 当:当: t 0.05 (差异无统计学意义差异无统计学意义) t 0.01() t t 0.05() 0.01 按所取检验水准不拒绝按所取
15、检验水准不拒绝H0 P 按所取检验水准拒绝按所取检验水准拒绝H02022-4-18 (三)假设检验时应注意的问题(三)假设检验时应注意的问题 保证比较的样本间有较好的均衡性和可比性;保证比较的样本间有较好的均衡性和可比性; 选用的假设检验方法应符合其应用条件;选用的假设检验方法应符合其应用条件; 正确理解差别有无显著性的统计意义;正确理解差别有无显著性的统计意义; 结论不能绝对化;结论不能绝对化; 报告结论时应列出统计量值,注明单侧或双报告结论时应列出统计量值,注明单侧或双 侧检验,写出侧检验,写出P P值的确切范围值的确切范围2022-4-18 t- 检验检验 (t -test or Stu
16、dents test )(一)样本均数与总体均数比较的(一)样本均数与总体均数比较的t 检验检验 目的:推断样本所代表的未知总体均数目的:推断样本所代表的未知总体均数与与 已知的总体均数已知的总体均数0有无差别有无差别(0 一般一般 为理论值、标准值或经过大量观察所为理论值、标准值或经过大量观察所 得的稳定值等得的稳定值等) 条件:理论上要求资料来自正态分布总体条件:理论上要求资料来自正态分布总体 -0 公式:公式:t = = n 1 S2022-4-18例例1 1、根据大量调查,已知健康成年男子脉、根据大量调查,已知健康成年男子脉搏数为搏数为7272次次/ /分。某医生在山区随机抽查分。某医
17、生在山区随机抽查2525名健康成年男子,求得其脉搏均数为名健康成年男子,求得其脉搏均数为74.274.2次次/ /分,标准差为分,标准差为6.56.5次次/ /分。能否据此认为分。能否据此认为山区成年男子的脉搏数高于一般?山区成年男子的脉搏数高于一般?2022-4-181、H0:=0, H1:0, =0.052、 -0 74.2-7274.2-72 t = = = 1.6921.692 S 6.5/6.5/253、自由度、自由度 = = n1 = 25-1=241 = 25-1=24,查,查t t值表值表(单侧)(单侧) 得得t t0.050.05(2424)= 1.711= 1.711。 t
18、 = 1.6921.711t = 1.6920.05P0.054 4、在、在 =0.05=0.05水准上,接受水准上,接受H0,不能认为该山区成,不能认为该山区成年男子的脉搏数高于一般。年男子的脉搏数高于一般。2022-4-18(二)配对设计(二)配对设计差值均数与总体均数差值均数与总体均数0 0比较比较t 检验检验 同源配对同源配对配对方法配对方法 异源配对异源配对目的:推断两种处理的效果有无差别或推断某种处目的:推断两种处理的效果有无差别或推断某种处 理有无作用理有无作用条件:样本来自正态总体条件:样本来自正态总体公式:公式: d 0 d t = = = n -1 S d S d /n20
19、22-4-18n为对子数为对子数(三)完全随机设计的两样本均数的比较(三)完全随机设计的两样本均数的比较目的:推断两样本均数分别代表的总体均数目的:推断两样本均数分别代表的总体均数1 与与2有无差别。有无差别。 1) 两样本含量较小时,且要求两样本总体方差相等两样本含量较小时,且要求两样本总体方差相等公式:公式: 1 -2 t = = ( n1 - 1) + ( n2 - 1) S1 -2 1 1 S 1 -2 = Sc2 ( + ) n1 n22022-4-18 ( n1-1) s12+( n2 -1)s22 Sc2 = n1+ n2 - 2 x1 - x2 t = (n1-1) s12+(
20、n2-1) s22 1 1 ( + ) n1+ n2-2 n1 n22022-4-18 2) 两样本含量足够大,如两样本含量足够大,如n50或或100时时 U- 检验检验应用条件:应用条件:当当 n 较大较大(n 50)或或 n 虽小,但总虽小,但总 体标准差已知,可用体标准差已知,可用 U 检验检验公式公式: 1 -2 1 -2 U = = S1 -2 S12 S22 + n1 n22022-4-1804分类资料的统计描述分类资料的统计描述2022-4-18计数资料常用的统计指标,计数资料常用的统计指标, 又称相对指标(又称相对指标(Relation number) 率率 常用相对数常用相对
21、数 构成比构成比 相对比相对比 2022-4-18 * 频率指标,表示某现象发生的频率指标,表示某现象发生的频率和强度频率和强度* 计算公式:计算公式: 实际发生某现象的观察数实际发生某现象的观察数 率率= K 可能发生某现象的观察单位总数可能发生某现象的观察单位总数2022-4-18 * 又称构成指标,表示某一事物内部各又称构成指标,表示某一事物内部各 组成部分所占的比重或分布。组成部分所占的比重或分布。 * 计算公式:计算公式: 某一事物各组成部分的个体数某一事物各组成部分的个体数 构成比构成比 = 100% 同一事物各组成部分的个体总数同一事物各组成部分的个体总数2022-4-18 *
22、表示两个有联系的指标(绝对数,相对数表示两个有联系的指标(绝对数,相对数 或平均数)之比,说明对比水平。或平均数)之比,说明对比水平。* 计算公式:计算公式: A 指标指标 相对比相对比 = (或(或 100%100%) B 指标指标 1 1)对比指标:两个有关同类指标之比,如两地)对比指标:两个有关同类指标之比,如两地 肿瘤死亡比肿瘤死亡比 2 2)关系指标:两个有关非同类指标之比,如每)关系指标:两个有关非同类指标之比,如每 千人病床数千人病床数2022-4-181. 不要把构成比当作率分析不要把构成比当作率分析(最容易混淆)(最容易混淆) - 年龄组(岁)年龄组(岁) 人口数人口数 癌肿
展开阅读全文