分类变量资料统计分析讲义课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《分类变量资料统计分析讲义课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 分类 变量 资料 统计分析 讲义 课件
- 资源描述:
-
1、分类变量资料分类变量资料的统计分析的统计分析统计推断统计推断u u检验、检验、检验检验2参数估计参数估计假设检验:假设检验:频数分布频数分布集中趋势指标集中趋势指标离散趋势指标离散趋势指标医学参考值范围估计医学参考值范围估计数值变量资料数值变量资料的统计分析的统计分析统计描述统计描述统计推断统计推断u u 检验检验t t 检验检验方差分析方差分析统计描述统计描述 相对数相对数参数估计参数估计假设检验假设检验第十六章第十六章 分类变量的统计分析分类变量的统计分析第第1-31-3节节 统计描述统计描述刘颖刘颖 预防医学教研室预防医学教研室掌握:掌握:n 常用相对数指标的意义、计算方法和注意事项;常
2、用相对数指标的意义、计算方法和注意事项;n 率的标准误和总体率可信区间的估计方法及意义;率的标准误和总体率可信区间的估计方法及意义;n u 检验和检验和 检验的适用条件和计算方法。检验的适用条件和计算方法。2熟悉:熟悉:n 率的标准化的意义和计算方法率的标准化的意义和计算方法1常用相对数常用相对数2应用相对数的注意事项应用相对数的注意事项3率的标准化率的标准化第一节第一节 常用相对数常用相对数绝对数(绝对数(absolute number)分类变量资料整分类变量资料整理后所得到的数据。理后所得到的数据。相对数(相对数(relative number)分类变量资料的分类变量资料的统计描述指标。统
3、计描述指标。例例1 某年某地流行性乙型脑炎发病某年某地流行性乙型脑炎发病 240 例、麻疹例、麻疹发病发病 200 例。例。240、200 绝对数绝对数绝对数说明在一定条件下该地该病实际发生的绝对绝对数说明在一定条件下该地该病实际发生的绝对水平,是制订疾病防治计划和统计分析的基础。水平,是制订疾病防治计划和统计分析的基础。甲地麻疹发病率甲地麻疹发病率=240/2000=12%乙地麻疹发病率乙地麻疹发病率=200/1000=20%发病人数发病人数易感儿童易感儿童甲地甲地 240 2000乙地乙地 200 1000例例2常用相对数常用相对数 1.率(率(rate)又称频率指标或强度指标;又称频率指
4、标或强度指标;说明说明某现象发生的频率或强度某现象发生的频率或强度;常以常以%、1/万、万、1/10万等表示。万等表示。可能可能发生某现象的单位总数发生某现象的单位总数发生某现象的观察单位发生某现象的观察单位数数率率=比例基数比例基数例例3 某年某市三个区的肠道传染病发病率某年某市三个区的肠道传染病发病率区区 人口数人口数 发病人数发病人数 发病率发病率()甲甲 98740 503 5.09乙乙 75135 264 3.51丙丙 118730 466 3.92合计合计 292605 1233 4.21甲区发病率甲区发病率=503/98740=5.09总发病率总发病率=1233/292605=4
5、.212.构成比构成比(constituent ratio)又称构成指标或结构指标,说明又称构成指标或结构指标,说明某一事物内部某一事物内部各组成部分的比重或分布各组成部分的比重或分布,常以百分数表示。,常以百分数表示。某一组成部分的观察单位数某一组成部分的观察单位数同一事物各组成部分的观察单位数同一事物各组成部分的观察单位数构成比构成比=100%表表16.1 2000年某医院某病住院与死亡人数年某医院某病住院与死亡人数病情严重程度病情严重程度 住院人数住院人数 病死数病死数 死亡构成死亡构成(%)病死率病死率(%)轻轻 300 12 26.7 4.0 中中 350 18 40.0 5.1 重
6、重 150 15 33.3 10.0 合计合计 800 45 100.0 5.6构成比的构成比的特点特点n 各构成部分的构成比总和为各构成部分的构成比总和为100%;n 某一部分所占比重的增减,会相应地影响某一部分所占比重的增减,会相应地影响其他部分,各构成比之间是相互制约的其他部分,各构成比之间是相互制约的。3.相对比(相对比(relative ratio)表示表示两个有关指标之比两个有关指标之比,常以倍数或,常以倍数或百分数表示。百分数表示。甲指标甲指标乙指标乙指标相对比相对比=(或或100%)例例5 2000 年我国第五次人口普查结果,男年我国第五次人口普查结果,男 65355 万人,女
7、子万人,女子 61228 万人,试计算人口男女性别比。万人,试计算人口男女性别比。6535561228性别比性别比 =1.067例例6 某市乙型脑炎的发病率某市乙型脑炎的发病率 1990 年为年为 4.48/10 万,万,2000 年为年为 0.88/10 万,试计算相对比。万,试计算相对比。相对比相对比=4.48/0.88=5.1(倍倍)相对比相对比=0.88/4.48100%=19.64%例例16.3 甲、乙两地肺癌死亡率分别为甲、乙两地肺癌死亡率分别为23.1/10万、万、12.33/10万,则两地死亡率的相对比为万,则两地死亡率的相对比为23.1/12.33=1.87,即甲地肺癌死亡率
8、是乙地的,即甲地肺癌死亡率是乙地的1.87倍,倍,RR=1.87。n 计算相对数时分母不宜过小,即观察单位数应计算相对数时分母不宜过小,即观察单位数应足够多。足够多。n 分析时构成比和率不能混淆(见表分析时构成比和率不能混淆(见表16-1)构成比构成比说明事物内部各组成部分的比重或分布;说明事物内部各组成部分的比重或分布;率率说明现象发生的频率或强度。说明现象发生的频率或强度。第二节第二节 应用相对数的应用相对数的注意事项注意事项表表16.1 2000年某医院某病住院与死亡人数年某医院某病住院与死亡人数病情严重程度病情严重程度 住院人数住院人数 病死数病死数 死亡构成死亡构成(%)病死率病死率
9、(%)轻轻 300 12 26.7 4.0 中中 350 18 40.0 5.1 重重 150 15 33.3 10.0 合计合计 800 45 100.0 5.6n 相对数的比较应注意可比性相对数的比较应注意可比性 观察对象同质、研究方法相同、观察时观察对象同质、研究方法相同、观察时间相等,以及客观条件一致;间相等,以及客观条件一致;资料内部构成是否相同。资料内部构成是否相同。n 率的标准化率的标准化n 要考虑存在抽样误差要考虑存在抽样误差 率或构成比的比较应做假设检验率或构成比的比较应做假设检验第三节第三节 率的标准化法率的标准化法 率的标准化法(率的标准化法(standardizatio
10、n)在一个指定的标在一个指定的标准构成条件下进行率的对比的方法。准构成条件下进行率的对比的方法。实际工作中,对两个或多个频率指标进行比较实际工作中,对两个或多个频率指标进行比较时,若各组对象内部构成存在差异,且差异又影响时,若各组对象内部构成存在差异,且差异又影响分析结果,应该用率的标准化法进行比较。分析结果,应该用率的标准化法进行比较。表表16.2 甲、乙两医院的治愈率甲、乙两医院的治愈率 科别科别 住院人数住院人数 治愈人数治愈人数 治愈率治愈率(%)甲医院甲医院 乙医院乙医院 甲医院甲医院 乙医院乙医院 甲医院甲医院 乙医院乙医院 内科内科 1500 500 975 315 65.0 6
11、3.0 外科外科 500 1500 470 1365 94.0 91.0传染病科传染病科 500 500 475 460 95.0 92.0 合计合计 2500 2500 1920 2140 76.8 85.61.用用“标准人口标准人口”计算计算(1)选定标准:)选定标准:两医院各型病人相加;两医院各型病人相加;标准的选择方法:标准的选择方法:n 选择有代表性、较稳定、数量较大的人群,如全选择有代表性、较稳定、数量较大的人群,如全 国、全省的历年累计数据;国、全省的历年累计数据;n 在互相比较的两组资料中,任选其中一组或两组在互相比较的两组资料中,任选其中一组或两组 合并作为共同标准。合并作为
12、共同标准。标准化率的计算(直接法)标准化率的计算(直接法)(2)计算甲、乙两医院各型传染病病人的预期治愈)计算甲、乙两医院各型传染病病人的预期治愈人数:人数:各型病人标准人口数分别乘以相应的原治愈各型病人标准人口数分别乘以相应的原治愈率;率;(3)计算甲、乙两医院传染病的标准化治愈率:)计算甲、乙两医院传染病的标准化治愈率:各各型病人预期治愈人数相加除以标准总人数。型病人预期治愈人数相加除以标准总人数。表表16.3 标准人口数计算甲、乙两医院标准化治愈率(直接法)标准人口数计算甲、乙两医院标准化治愈率(直接法)科别科别 标准人标准人 原治愈率原治愈率(%)预期治愈人数预期治愈人数 口数口数 甲
13、医院甲医院 乙医院乙医院 甲医院甲医院 乙医院乙医院 内科内科 2000 65.0 63.0 1300 1260 外科外科 2000 94.0 91.0 1880 1820传染病科传染病科 1000 95.0 92.0 950 920合计合计 5000 76.8 85.6 4130 4000乙医院标化治愈率乙医院标化治愈率=乙医院预期治愈人数之和乙医院预期治愈人数之和/标准组总人数标准组总人数 =4000/5000*100%=80%2.用用“标准人口构成比标准人口构成比”计算计算(1)将标准病人数换算成构成比;)将标准病人数换算成构成比;(2)计算甲、乙两医院各型传染病的分配治愈率:)计算甲、
14、乙两医院各型传染病的分配治愈率:标准人口构成比乘以相应原治愈率;标准人口构成比乘以相应原治愈率;(3)计算甲、乙两医院某传染病的标准化治愈率:)计算甲、乙两医院某传染病的标准化治愈率:各型传染病分配治愈率相加。各型传染病分配治愈率相加。表表16.4 标准人口构成比计算甲、乙两医院标准化治愈率标准人口构成比计算甲、乙两医院标准化治愈率 科别科别 标准人口标准人口 原治愈率原治愈率(%)预期治愈率预期治愈率 构成比构成比 甲医院甲医院 乙医院乙医院 甲医院甲医院 乙医院乙医院 内科内科 0.4 65.0 63.0 26.0 25.2 外科外科 0.4 94.0 91.0 37.6 36.4传染病科
15、传染病科 0.2 95.0 92.0 19.0 18.4合计合计 1.0 76.8 85.6 82.6 80.0应用标准化法时的应用标准化法时的注意事项注意事项n 当各比较组内部构成不同,并足以影响总当各比较组内部构成不同,并足以影响总率的比较时,应对率进行标准化后再作比较;率的比较时,应对率进行标准化后再作比较;n 率的标准化的目的是消除混杂因素影响,率的标准化的目的是消除混杂因素影响,使其具可比性;使其具可比性;n 各年龄组对应的率出现明显交叉时,宜各年龄组对应的率出现明显交叉时,宜分别比较各年龄组死亡率,而不用标准化进分别比较各年龄组死亡率,而不用标准化进行比较;行比较;n 如是抽样研究
16、,两样本标准化率的比较如是抽样研究,两样本标准化率的比较应作假设检验。应作假设检验。n 标准化率已不能反映率的实际水平,它标准化率已不能反映率的实际水平,它 只能表明相互比较资料间的相对水平;只能表明相互比较资料间的相对水平;n 选定的标准构成不同,所得的标准化率选定的标准构成不同,所得的标准化率 也不同,仅限于采用共同标准构成的组也不同,仅限于采用共同标准构成的组 间比较。间比较。统统 计计推推 断断统统 计计描描 述述统计分析统计分析第十六章第十六章 分类变量的统计分析分类变量的统计分析第第4-64-6节节 统计推断统计推断刘刘 颖颖预防医学教研室预防医学教研室1率的抽样误差和总体率的估计
17、率的抽样误差和总体率的估计2率的率的 u 检验检验3 检验检验2一、率的抽样误差和标准误一、率的抽样误差和标准误 率的抽样误差的大小用率的抽样误差的大小用率的标准误率的标准误表示。表示。第四节率的抽样误差和总体率的估计第四节率的抽样误差和总体率的估计1pn1pppSn例例16.5 欲了解某种新药对慢性乙型肝炎的疗欲了解某种新药对慢性乙型肝炎的疗效,对效,对100名患者进行治疗,其中名患者进行治疗,其中90人有效,人有效,试计算其标准误。试计算其标准误。10.9 1 0.90.03100pppSn一、正态近似法一、正态近似法适用条件:适用条件:np 和和 n(1-p)5 时,可根据近似正态分布时
18、,可根据近似正态分布 的原理估计其可信区间。的原理估计其可信区间。例例16.5 试求该新药有效率的试求该新药有效率的95%可信区间?可信区间?二、总体率的二、总体率的可信区间估计可信区间估计0.91.960.03 0.091.960.030.8412 0.9588ppuS,二、查表法二、查表法 适用条件:适用条件:n 50,特别是,特别是 p 接近接近 0 或或 1 时,时,此时资料呈二项分布,可按二项分布的原理估计总体此时资料呈二项分布,可按二项分布的原理估计总体率的可信区间。率的可信区间。一、样本率与总体率比较的一、样本率与总体率比较的u 检验检验目的:目的:推断样本率与总体率的差异是否仅
19、由抽样所推断样本率与总体率的差异是否仅由抽样所 致,其差异是否有统计学意义。致,其差异是否有统计学意义。总体率:总体率:一般是理论值、标准值或是经过大量观察一般是理论值、标准值或是经过大量观察 所得的稳定值。所得的稳定值。第五节率的第五节率的 u 检验检验u1pn其中:其中:为样本率为样本率 为总体率为总体率 n 为样本含量为样本含量p例例16.7 某地区一般人群中乙型肝炎的阳性率为某地区一般人群中乙型肝炎的阳性率为15%,现对该地区,现对该地区150名流浪者进行检查,其中阳名流浪者进行检查,其中阳性性30人,问当地流浪者的阳性率是否高于一般人群人,问当地流浪者的阳性率是否高于一般人群的阳性率
20、?的阳性率?本例样本率为本例样本率为50%,np 和和 n(1-p)5 时,可认为时,可认为呈近似正态分布,故可采用呈近似正态分布,故可采用 u 检验。检验。1.检验假设检验假设H0:,当地流浪者阳性率与一般人群相同,当地流浪者阳性率与一般人群相同H1:,当地流浪者阳性率高于一般人群,当地流浪者阳性率高于一般人群单侧单侧 00.1500.0 52.计算计算 u 值值 3.确定确定 P 值值 ,下结论,下结论 u=1.715 1.645,P 0.05,按,按a=0.05的检验水准,拒的检验水准,拒绝绝H0,接受,接受H1,认为当地流浪者的阳性率高于一般人群。,认为当地流浪者的阳性率高于一般人群。
21、0000.20.15u1.71510.15 1 0.15150pn目的:目的:推断两样本率是否来自同一总体。推断两样本率是否来自同一总体。适用条件:适用条件:样本率符合近似正态分布的条件样本率符合近似正态分布的条件(n 较大,且较大,且 P 和和 1-P 不太小,即不太小,即 np 和和 n(1-p)5时),可用率的时),可用率的 u 检验。检验。二、两样本率比较的二、两样本率比较的 u 检验检验1212u111ccppppnn 式中:式中:、为样本率,为样本率,n1、n2为样本例数,为样本例数,X1、X2为阳性例数,为阳性例数,为两样本合并率。为两样本合并率。cp1p12c12pXXnn2p
22、例例16.8 欲了解从事工农业生产的欲了解从事工农业生产的50岁以上人群高血岁以上人群高血压的情况,调查了首钢工人压的情况,调查了首钢工人1281人,高血压患者人,高血压患者386人,患病率为人,患病率为30.13%;石景山区农民;石景山区农民387人,高血人,高血压压患者患者65人,患病率为人,患病率为16.80%,试问从事工农业生产,试问从事工农业生产的的50岁以上人群高血压患病率有无差别?岁以上人群高血压患病率有无差别?本例两样本的乙肝携带人数均大于本例两样本的乙肝携带人数均大于5,故,故可采用样本率的可采用样本率的 u 检验。检验。1.建立检验假设建立检验假设 H0:H1:12120.
23、0 52.计算计算 u 值值 12c121212386 65p0.27041281 3870.3013 0.1685.1711110.2704 1 0.270411281 387ccXXnnppuppnn3.确定确定 P 值值 ,下结论,下结论 u=5.17 1.96,P 0.05,按,按 a=0.05 的检验的检验水准,拒绝水准,拒绝H0,接受,接受H1,从事工业生产和农业生从事工业生产和农业生产的产的50岁以上人群高血压患病率不同。岁以上人群高血压患病率不同。第六节第六节 检验检验 检验(检验(chi-square test)适用于:适用于:分类变量资料中两个或多个样本的总体率是否分类变量
24、资料中两个或多个样本的总体率是否相同相同,两个或多个样本的构成比是否相同,配对资,两个或多个样本的构成比是否相同,配对资料两种属性间的阳性率是否相等。料两种属性间的阳性率是否相等。22(一)四格表的(一)四格表的 检验检验基本思想基本思想 可用于两样本率的比较可用于两样本率的比较 表表16-7 四格表四格表 检验的检验的基本结构基本结构一、一、四格表四格表的的 检验检验22 处理处理 发生数发生数 未发生数未发生数 合计合计 A组组 a b a+b B组组 c d c+d 合计合计 a+c b+d n2nnnTCRRCncabaT11ndbbaT12ndccaT21ndbdcT22上表中第上表
25、中第 R 行、第行、第 C 列的理论频数为:列的理论频数为:因此:因此:如果四格表中实际的发生数用如果四格表中实际的发生数用 A 来表示,来表示,可通过下式计算可通过下式计算 值:值:2TTA22基本思想:实际频数与理论频数吻合程度基本思想:实际频数与理论频数吻合程度。在检验假设成立的情况下,在检验假设成立的情况下,A 与与 T 之差一般不之差一般不会很大,此时会很大,此时 值也较小;反之,值也较小;反之,值较大。值较大。检验的检验的自由度:自由度:v=(行数(行数-1)(列数)(列数-1)22例例16.9 某医生欲比较某医生欲比较A、B两种药物治疗老年期抑两种药物治疗老年期抑郁症的效果,将病
展开阅读全文