书签 分享 收藏 举报 版权申诉 / 34
上传文档赚钱

类型分类变量的统计推断-课件.ppt

  • 上传人(卖家):三亚风情
  • 文档编号:3439450
  • 上传时间:2022-08-31
  • 格式:PPT
  • 页数:34
  • 大小:341.50KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《分类变量的统计推断-课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    分类 变量 统计 推断 课件
    资源描述:

    1、1广州医学院预防医学系广州医学院预防医学系2*率的抽样误差率的抽样误差:由抽样造成的样本率与总体率的由抽样造成的样本率与总体率的差别,或样本率之间的差别。差别,或样本率之间的差别。*率的标准误率的标准误:表示率的抽样误差大小的统计指标表示率的抽样误差大小的统计指标。(Sp 为为 p的估计值的估计值,p为为 的估计值的估计值)*公式计算公式计算:(1-)p(1-p)p=;Sp=n n 3正态近似法:正态近似法:当当n足够大足够大,若,若 n p 5 和和n(1-p)5,则总体率则总体率(1-)可信区间为:可信区间为:总体率总体率95%可信区间为可信区间为 p 1.96 sp 总体率总体率99%可

    2、信区间为可信区间为 p 2.58 sp 4例:例:某地中学生就餐方式与乙肝病毒感染情况调查某地中学生就餐方式与乙肝病毒感染情况调查 就餐方式就餐方式 调查人数调查人数 感染人数感染人数 感染率感染率(%)常在外就餐常在外就餐(A)89 6 6.74 不在外就餐不在外就餐(B)111 5 4.50合计合计 200 11 5.50 p(1 p)Sp=n0.0266=2.66%0.0674(1-0.0674)Sp=89(A):(B):0.0450(1-0.0450)Sp=1110.0197=1.97%5 例:例:某地中学生就餐方式与乙肝病毒感染情况调查某地中学生就餐方式与乙肝病毒感染情况调查 就餐方

    3、式就餐方式 调查人数调查人数 感染人数感染人数 感染率感染率(%)标准误标准误 常在外就餐常在外就餐(A)89 6 6.74 2.66%不在外就餐不在外就餐(B)111 5 4.50 1.97%总体率总体率95%可信区间为可信区间为 p 1.96 sp总体率总体率99%可信区间为可信区间为 p 2.58 sp 总体感染率总体感染率95%可信区间:可信区间:(A):6.74%1.962.66%=1.53%11.95%(B):4.50%1.961.97%=0.64%8.36%6 1.样本率与总体率比较样本率与总体率比较目的:目的:推断样本率所代表的总体率推断样本率所代表的总体率 与某总体与某总体率

    4、率 0 是否相等。是否相等。|p-0|u =p|p-0|u =0(1-0)/n条件:条件:np 5 和和 n(1-p)5公式公式:7例:某地城镇例:某地城镇25岁以上居民高血压患病率为岁以上居民高血压患病率为 11,随机抽查该地矿区,随机抽查该地矿区25岁以上居民岁以上居民598 人,确诊高血压者有人,确诊高血压者有82人。矿区居民与城镇人。矿区居民与城镇 居民高血压患病率有何不同?居民高血压患病率有何不同?城镇居民高血压患病率:城镇居民高血压患病率:0=11=0.11 矿区居民高血压患病率:矿区居民高血压患病率:p=82/598=0.14 分析目的:分析目的:推断推断 8假设:假设:H0:=

    5、0=0.11,H1:0 0.11,0.05 p-0u =0(1-0)/n 0.14-0.11 0.11(1-0.11)/598=2.34结论:可认为矿区居民高血压患病率高于城镇居民结论:可认为矿区居民高血压患病率高于城镇居民9 2.两个样本率比较两个样本率比较(完全随机设计完全随机设计)目的:目的:推断两样本率分别代表的总体率推断两样本率分别代表的总体率 1与与 2是否相等。是否相等。|p1-p2|u=S p1-p2 _ 1 1 S p1-p2=pc(1-pc)(+)n1 n2(pc为两个样本率的合并率。)为两个样本率的合并率。)条件:条件:两样本率近似正态分布,即两样本率近似正态分布,即 n

    6、1p1、n1(1-p1)和和 n2p2、n2(1-p2)均大于均大于 5。公式:公式:10例:例:某地某地5570岁居民体重指数与糖尿病关系岁居民体重指数与糖尿病关系体重指数体重指数 检查人数检查人数 糖尿病人数糖尿病人数 患病率患病率25 988 52 5.26 25 682 69 10.11合计合计 1670 121 7.25是否体重指数是否体重指数(BMI)不同糖尿病的患病率不同?不同糖尿病的患病率不同?BMI 25:p=5.26%BMI 25:p =10.11%11假设:假设:H0:=,H1:,=0.05 _ 1 1 S p1-p2=pc(1-pc)(+)n1 n2|p1-p2|u=S

    7、 p1-p2 0.0725(1-0.0725)(1/988+1/682)=|0.0526-0.1011|=3.76P 0.01结论:结论:BMI 25者糖尿病患病率高于者糖尿病患病率高于BMI 25者者 BMI与糖尿病有关与糖尿病有关12 1.用途:用途:推断两个或多个总体率(或总体构成推断两个或多个总体率(或总体构成 比)之间有无差别,以及配对资料的比)之间有无差别,以及配对资料的 比较比较。2.2 检验的基本思想检验的基本思想例:例:甲乙两种疗法治疗肺癌的甲乙两种疗法治疗肺癌的2年生存率年生存率疗法疗法 治疗人数治疗人数 生存人数生存人数 2年生存率年生存率 甲甲 46 22 47.83

    8、乙乙 58 35 60.34合计合计 104 57 54.81两种疗法的两种疗法的2年生存率是否不同?年生存率是否不同?13 甲乙两种疗法治疗肺癌生存率比较的四格表甲乙两种疗法治疗肺癌生存率比较的四格表疗法疗法 生存生存 死亡死亡 合计合计 生存率生存率 甲甲 22 24 46 47.83 乙乙 35 23 58 60.34合计合计 57 47 104 54.81假设:两疗法生存率一致为假设:两疗法生存率一致为 甲疗法的生存人数甲疗法的生存人数 T1.1 :4657/10425.21 乙疗法的生存人数乙疗法的生存人数 T2.1 :5857/10431.79 假设:假设:两疗法病死率一致为两疗法

    9、病死率一致为 甲疗法的病死人数甲疗法的病死人数 T1.2 :4647/10420.79 乙疗法的病死人数乙疗法的病死人数 T2.2 :5847/10426.21(nR)(nC)(n)14 甲乙两种疗法治疗肺癌生存率比较的四格表甲乙两种疗法治疗肺癌生存率比较的四格表疗法疗法 生存生存 死亡死亡 合计合计 生存率生存率 A T A T 甲甲 22(25.21)24(20.79)46 47.83 乙乙 35(31.79)23(26.21)58 60.34合计合计 57 47 104 n 54.81基本公式:基本公式:A 实际值实际值 T 理论值理论值15 3.2检验的种类检验的种类 (1)四格表资料

    10、的四格表资料的 2检验检验(完全随机设计完全随机设计)(2 test for fourfold table)目的:目的:用于两个样本率或构成比的比较,推用于两个样本率或构成比的比较,推断两个样本所代表的总体率(或总体断两个样本所代表的总体率(或总体构成比)是否相等。构成比)是否相等。专用公式:专用公式:基本公式:基本公式:16 甲乙两种疗法治疗肺癌生存率比较的四格表甲乙两种疗法治疗肺癌生存率比较的四格表疗法疗法 生存生存 死亡死亡 合计合计 生存率生存率 A T A T 甲甲 22(25.21)24(20.79)46 47.83 乙乙 35(31.79)23(26.21)58 60.34合计合

    11、计 57 47 104 54.81检验假设:检验假设:H0:12 ,H1:12,0.05 2(2225.21)2/25.21+(35 31.79)2/31.79 +(24 20.79)2/20.79+(23 26.21)2/26.21=1.62 17 甲乙两种疗法治疗肺癌生存率比较的四格表甲乙两种疗法治疗肺癌生存率比较的四格表疗法疗法 生存生存 死亡死亡 合计合计 生存率生存率 甲甲 22 24 46 47.83 乙乙 35 23 58 60.34合计合计 57 47 104 54.81(a)(b)(c)(d)(a+b)(c+d)(a+c)(b+d)(n)18 方法方法 阳性数阳性数 阴性数阴

    12、性数 合合 计计 甲甲 a b a+b 乙乙 c d c+d 合计合计 a+c b+d n 统统 计计 结结 论论 19 四格表四格表 2值的校正值的校正当:当:1 T 40 时,需计算校正时,需计算校正 2值值 当:当:T 1,或,或 n 0.05(4.9)(84.1)(6.1)(104.9)22穿新旧两种防护服工人皮炎患病率比较的四格表穿新旧两种防护服工人皮炎患病率比较的四格表种类种类 患皮炎患皮炎 未患皮炎未患皮炎 合计合计 患病率患病率 新新 1 14 15 6.7 旧旧 10 18 28 35.7合计合计 11 32 43 25.6(3.84)(11.16)(7.16)(20.84)

    13、23基本公式:基本公式:=(行(行-1)(列列-1)=(R-1)(C-1)(2)行)行 列表资料的列表资料的 2 检验检验 (2 test for R C table )目的:用于多个样本率(或构成比)的比较目的:用于多个样本率(或构成比)的比较,推断样本所代表的几个总体率(或总推断样本所代表的几个总体率(或总 体构成比)之间有无差别。体构成比)之间有无差别。专用公式:专用公式:24 三种药物治疗失眠有效率比较的三种药物治疗失眠有效率比较的RC表表 组别组别 有效有效 无效无效 合计合计 有效率有效率%新新 药药 6 42 48 12.50传统药传统药 11 26 37 29.73安慰剂安慰剂

    14、 29 8 37 78.38 合计合计 46 76 122 37.70 =(R-1)(C-1)25 三种药物治疗失眠有效率比较的三种药物治疗失眠有效率比较的RC表表 组别组别 有效有效 无效无效 合计合计 有效率有效率%新新 药药 6 42 48 12.50传统药传统药 11 26 37 29.73安慰剂安慰剂 29 8 37 78.38 合计合计 46 76 122 37.70 2=40.05,2 0.005(2)=10.60三种药物治疗失眠有效率不同或不全相同三种药物治疗失眠有效率不同或不全相同新药组新药组 12.50%传统药组传统药组29.73%新药组新药组 12.50%安慰剂组安慰剂组

    15、78.38%传统药组传统药组29.73%安慰剂组安慰剂组78.38%组间比较:卡方分割组间比较:卡方分割26 当推断结论为拒绝当推断结论为拒绝 H0 时,是认为各总体率时,是认为各总体率(或总体构成比)不等或不全相等,即只能认(或总体构成比)不等或不全相等,即只能认 为其中至少有两个总体率(或总体构成比)不为其中至少有两个总体率(或总体构成比)不 等,而不能确定任意两个总体率(或总体构成等,而不能确定任意两个总体率(或总体构成比)不等。比)不等。当当有有 1/5 及以上格子的及以上格子的 T 5,或有一个格子或有一个格子 T 40 时时 两种方法检测鼻咽癌结果比较两种方法检测鼻咽癌结果比较甲法甲法 乙乙 法法 合计合计 261 110 371 8 31 39 合计合计 269 141 410(a)(b)(c)(d)P 0.005结论:甲法阳性率结论:甲法阳性率(371/410)高于乙法高于乙法(269/410)332)异源配对:以一定的条件把观察对象配成对)异源配对:以一定的条件把观察对象配成对 子,子,肺肺 癌癌 的的 病病 例例 对对 照照 研研 究究 肺肺 癌癌 合计合计 吸烟吸烟 不吸烟不吸烟 吸吸 烟烟 a b a+b对照对照 不吸烟不吸烟 c d c+d合计合计 a+c b+d n34

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:分类变量的统计推断-课件.ppt
    链接地址:https://www.163wenku.com/p-3439450.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库