书签 分享 收藏 举报 版权申诉 / 71
上传文档赚钱

类型分类变量资料的统计分析培训课件.ppt

  • 上传人(卖家):三亚风情
  • 文档编号:2532820
  • 上传时间:2022-05-01
  • 格式:PPT
  • 页数:71
  • 大小:745.50KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《分类变量资料的统计分析培训课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    分类 变量 资料 统计分析 培训 课件
    资源描述:

    1、第十章第十章精1主要内容主要内容分类变量资料的统计描述分类变量资料的统计描述分类变量资料的统计推断分类变量资料的统计推断卡方检验卡方检验精2什么是分类变量资料?什么是分类变量资料?用什么指标进行描述?用什么指标进行描述?甲、乙两地发生麻疹流行,甲地患儿100人,乙地患儿50人,何地较为严重?若甲地易感儿童667人,而乙地易感儿童250人。甲地麻疹发病率为 100/667100%=15%乙地麻疹发病率为 50/250100%=20%精3第一节第一节 分类变量资料的统计描述分类变量资料的统计描述 常用相对数常用相对数 应用相对数时的注意事项应用相对数时的注意事项 率的标准化法率的标准化法精4相对数

    2、相对数 相对数相对数:是两个有关联的数值或指标之比。:是两个有关联的数值或指标之比。 常用的相对数有:常用的相对数有:率率构成比构成比相对比相对比精5率率(rate)率:率:是指在一定观察时间内,某现象实际发生数与是指在一定观察时间内,某现象实际发生数与可能发生该现象的总数之比,用以说明某现象发生可能发生该现象的总数之比,用以说明某现象发生的频率或强度。的频率或强度。K K为比例基数,如为比例基数,如100%100%、10001000等。比例基数的选择主要依等。比例基数的选择主要依习惯而定或使计算结果能保留习惯而定或使计算结果能保留1 12 2位整数。位整数。 K单位总数可能发生该现象的观察单

    3、位数实际发生某现象的观察率精6构成比构成比(constituent ratio) 构成比:构成比:是指事物内部某一部分的观察单位数与事是指事物内部某一部分的观察单位数与事物内部各组成部分的观察单位数总和之比,用以说物内部各组成部分的观察单位数总和之比,用以说明事物内部各部分所占的比重或分布。明事物内部各部分所占的比重或分布。100事物内部某一部分的观察单位数构成比事物内部各部分的观察单位数总和常用百分数表示,故又称百分比。常用百分数表示,故又称百分比。精7各部分构成比之和为各部分构成比之和为100%。此消彼长。此消彼长。构成比的两个特点:构成比的两个特点:精8例例10-1 2001年对某地中小

    4、学学生进行年对某地中小学学生进行HbsAg检查,检查,结果见表结果见表10-1,试计算各级学生,试计算各级学生HbsAg检出率及阳检出率及阳性者构成比性者构成比 率和构成比不是同一指标,在应用时应注意加以区分。率和构成比不是同一指标,在应用时应注意加以区分。 精9相对比相对比相对比:相对比:指两个有关指标之比,说明两个指标的比指两个有关指标之比,说明两个指标的比例关系。例关系。甲指标相对比(或 100)乙指标两个指标可以是绝对数、相对数、平均数,可以是性质相两个指标可以是绝对数、相对数、平均数,可以是性质相同或性质不同,但两个指标互不包含。同或性质不同,但两个指标互不包含。 精10例例10-2

    5、 某地某地2003-2005年不同性别新生儿数见表年不同性别新生儿数见表10-2,试计算该地不同年份新生儿性别比。,试计算该地不同年份新生儿性别比。 精11应用相对数的注意事项应用相对数的注意事项 计算相对数时分母不宜过小计算相对数时分母不宜过小 正确区分构成比和率,不能以构成比代替率正确区分构成比和率,不能以构成比代替率 正确计算平均率正确计算平均率 对率和构成比进行比较时,对率和构成比进行比较时,应注意资料的可比性应注意资料的可比性 率的标准化率的标准化 样本率或构成比进行比较时要作假设检验样本率或构成比进行比较时要作假设检验 精12率的标准化率的标准化精13 在进行两个内部构成不同的总率

    6、比较时,采在进行两个内部构成不同的总率比较时,采用统一的标准进行校正,然后计算校正后的标准用统一的标准进行校正,然后计算校正后的标准化率,再进行比较的方法称为率的标准化法。化率,再进行比较的方法称为率的标准化法。率的标准化法率的标准化法精14计算标准化率时,首先要选定一个比较的计算标准化率时,首先要选定一个比较的“标准标准”。如,对年龄构成进行标化时,可选用全国、全省等大范围人如,对年龄构成进行标化时,可选用全国、全省等大范围人口构成资料作标准,也可将比较组的合并人口或以其中任一口构成资料作标准,也可将比较组的合并人口或以其中任一组的人口构成作标准。组的人口构成作标准。原则上,选定的标准人口应

    7、有代表性、较稳定,容易获得,原则上,选定的标准人口应有代表性、较稳定,容易获得,便于比较。便于比较。根据获得的资料和选定的标准不同,标准化法可分为直接法根据获得的资料和选定的标准不同,标准化法可分为直接法和和间接法间接法。精15直接法直接法适用情况适用情况:已知被标化组各年龄组的实际率:已知被标化组各年龄组的实际率P Pi i,用标准人口数或标准人口构成进行计算。用标准人口数或标准人口构成进行计算。iiiiipCpNpNp或其中其中 为第为第i 组标准人口数,组标准人口数, 为标准组总人数,为标准组总人数, 为第为第i 组的实际率,组的实际率, 为第组标准人口构成。为第组标准人口构成。 iNi

    8、piCiN精16甲社区标准化后的患病率甲社区标准化后的患病率 乙社区标准化后的患病率乙社区标准化后的患病率表表 10-4 甲、乙两社区 20 岁以上居民高血压标准化患病率(直接法) 甲社区 乙社区 年龄组 标准 人口 iN 实际患病率(%) 1 ip 预期 患病数 1iipN 实际患病率(%) 2ip 预期 患病数 2iipN 20- 1539 10.86 167 11.76 181 35- 1665 21.48 358 22.88 381 50- 1584 34.69 549 36.96 585 65- 1675 53.44 895 56.01 938 合计 6463 (N) 1969 (1

    9、iipN) 2085 (2iipN) %47.30%10064631969p%26.32%10064632085p精17如根据选定的标准人口构成做标准,如根据选定的标准人口构成做标准, 精18间接法间接法适用情况:适用情况:已知被标化组的死亡总数及年龄别人已知被标化组的死亡总数及年龄别人口数,但不知道各年龄组的实际死亡率。口数,但不知道各年龄组的实际死亡率。iiPNrPP标准化死亡比标准化死亡比精19标准化死亡比:标准化死亡比:被标化组实际死亡数与预期死亡被标化组实际死亡数与预期死亡数之比,称为标准化死亡比(数之比,称为标准化死亡比(standard mortality ratio),简称为)

    10、,简称为SMR。若。若SMR1,表示被标化人,表示被标化人群的死亡率高于标准组;反之,若群的死亡率高于标准组;反之,若SMR1,表示被,表示被标化人群的死亡率低于标准组。标化人群的死亡率低于标准组。 iiPnrSMR/精20例例10-410-4 某地观察了吸烟者与不吸烟者各年龄组人数如表某地观察了吸烟者与不吸烟者各年龄组人数如表10-610-6,同时观察期内吸烟者中有,同时观察期内吸烟者中有432432人死于肺癌,不吸烟者人死于肺癌,不吸烟者中有中有210210人死于肺癌,试计算吸烟者与不吸烟者的标准化死人死于肺癌,试计算吸烟者与不吸烟者的标准化死亡率。亡率。 精21吸烟者的肺癌标准化死亡比吸

    11、烟者的肺癌标准化死亡比 2912467100432.SMR非吸烟者的肺癌标准化死亡比非吸烟者的肺癌标准化死亡比 2100.8620243.67SMR 精22吸烟者的肺癌标准化死亡率吸烟者的肺癌标准化死亡率 非吸烟者的肺癌标准化死亡率非吸烟者的肺癌标准化死亡率 万万10/83.298620.010/60.342p万万10/48.1482912.410/60.341p精23率的标准化应注意的问题率的标准化应注意的问题 (1 1)当各比较组内部构成(如年龄、性别等)不同时,)当各比较组内部构成(如年龄、性别等)不同时,应对率进行标准化后,再作比较。应对率进行标准化后,再作比较。(2 2)标准化率只表

    12、明各标化组率的相对水平,而不代表)标准化率只表明各标化组率的相对水平,而不代表其实际水平。其实际水平。(3 3)两总率各分组对应的率有明显交叉时,则不能用标)两总率各分组对应的率有明显交叉时,则不能用标准化率进行比较。准化率进行比较。(4 4)如为抽样研究资料,两样本标准化率的比较也应作)如为抽样研究资料,两样本标准化率的比较也应作假设检验。假设检验。 精24 率的抽样分布率的抽样分布 率的抽样误差与标准误率的抽样误差与标准误 总体率的区间估计总体率的区间估计 率比较的率比较的u u检验检验精25率的抽样分布率的抽样分布 从某个二项分类总体中随机抽取含量一定的样本,其从某个二项分类总体中随机抽

    13、取含量一定的样本,其样本率的分布概率是有规律的,这种规律为服从二项样本率的分布概率是有规律的,这种规律为服从二项分布(分布(binomial distribution),即样本中阳性数或样),即样本中阳性数或样本阳性率的分布概率等于二项式展开后各项。若总体本阳性率的分布概率等于二项式展开后各项。若总体阳性率为阳性率为、样本含量为、样本含量为n,阳性数为,阳性数为X,则样本中出,则样本中出现现X个阳性事件的概率可由下式求得。个阳性事件的概率可由下式求得。 n , 2, 1, , 0 )1 ()!( !)(XXnXnXPXnX精26已知:已知: =0.5,n =10; =0.3,n =5; =0.

    14、3,n =10; =0.3,n =15。试根据式(。试根据式(10-6)求各阳性数事件的概率)求各阳性数事件的概率并作概率分布图。并作概率分布图。 图图10-1 10-1 率的抽样分布图率的抽样分布图 精27率的抽样分布特征率的抽样分布特征1.为离散型分布;为离散型分布;2.2.当当 =1-=1-时,呈对称分布;时,呈对称分布;3.3.当当n n增大时,逐渐逼近正态分布。增大时,逐渐逼近正态分布。 一般认为,当一般认为,当nn和和n n(1-(1-)5)5时时, , 可近似看可近似看作正态分布。作正态分布。 精28率的抽样误差和标准误率的抽样误差和标准误 由于抽样所引起的样本率和总体率或各样本

    15、率由于抽样所引起的样本率和总体率或各样本率之间存在着差异,这种差异称为率的抽样误差。之间存在着差异,这种差异称为率的抽样误差。用率的标准误表示用率的标准误表示 。npnppsp精29例例10-6 10-6 为了解某地人群结核菌素试验阳性率情况,某医为了解某地人群结核菌素试验阳性率情况,某医疗机构在该地人群中随机检测了疗机构在该地人群中随机检测了17731773人,结核菌素试验阳人,结核菌素试验阳性有性有682682人,阳性率为人,阳性率为38.47%38.47%,试计算其标准误。,试计算其标准误。%16.10116.017733847.03847.0ps精30总体率的区间估计总体率的区间估计总

    16、体率的估计:总体率的估计:点估计点估计区间估计区间估计 正态近似法正态近似法 查表法查表法精31正态近似法正态近似法当样本含量当样本含量n足够大,样本率足够大,样本率p或或1-p均不太小时(如均不太小时(如np和和n(1-p)均大于均大于5),样本率的分布近似正态分布。),样本率的分布近似正态分布。 pSupu u 是标准正态分布双侧临界值,在估计总体率的是标准正态分布双侧临界值,在估计总体率的95%置信区间时,其值为置信区间时,其值为1.96;99%置信区间时,其值为置信区间时,其值为2.58。精3295%的置信区间:的置信区间: 38.47% 1.96 1.16%=36.20%40.74%

    17、99%的置信区间:的置信区间: 38.47% 2.58 1.16%=35.48%41.46% 例例10-6中该地人群中结核菌素试验阳性率中该地人群中结核菌素试验阳性率95%和和99%的置信区间为:的置信区间为:精33查表法查表法 当当n较小,如较小,如n 50,特别是,特别是p接近于接近于0或或1时,按二项分时,按二项分布原理估计总体率的可信区间。布原理估计总体率的可信区间。 因其计算比较复杂,统计学家已经编制了总体率可信因其计算比较复杂,统计学家已经编制了总体率可信区间估计用表,可根据样本含量区间估计用表,可根据样本含量n和阳性数和阳性数x查阅统计查阅统计学专著中的附表学专著中的附表 。精3

    18、4u u 检验检验 当样本含量当样本含量n足够大,样本率足够大,样本率p或或1-p均不均不太小时(如太小时(如np和和n(1-p)均大于均大于5),样本率的,样本率的分布近似正态分布。样本率和总体率之间、分布近似正态分布。样本率和总体率之间、两个样本率之间的比较可用两个样本率之间的比较可用u检验检验(u test) 。精35样本率与总体率的比较样本率与总体率的比较 1pppun精36例例10-7 10-7 一般情况下,直肠癌围术期并发症发生率一般情况下,直肠癌围术期并发症发生率为为30%30%,现某医院手术治疗了,现某医院手术治疗了385385例直肠癌患者,围例直肠癌患者,围术期出现并发症有术

    19、期出现并发症有100100例,并发症发生率为例,并发症发生率为26%26%,问,问该院直肠癌患者围术期并发症发生率与一般情况比该院直肠癌患者围术期并发症发生率与一般情况比较有无统计学差异。较有无统计学差异。本例,样本率为本例,样本率为26%,np和和n(1-p)均大于均大于5,可采,可采用用u检验。检验。精371. 建立检验假设建立检验假设 H0: = 0,H1: 0, =0.052. 计算计算u值值 3. 确定确定P值,判断结果值,判断结果本题本题u u=1.713=1.7131.961.96,P P0.05,0.05,按按 =0.05=0.05的水准不拒绝的水准不拒绝H H0 0,差异没有

    20、统计学意义,故尚不能认为该院直肠癌患者围差异没有统计学意义,故尚不能认为该院直肠癌患者围术期并发症发生率与一般情况不同。术期并发症发生率与一般情况不同。 713.1385)3.01(3.026.03.0u精38两个样本率的比较两个样本率的比较 121211(1)()ccppuppnn2121nnXXpc精39例例10-8 10-8 为了解某地小学生蛔虫感染率的城乡差异,抽样调查了该地为了解某地小学生蛔虫感染率的城乡差异,抽样调查了该地小学生小学生2279222792人,其中城镇小学生人,其中城镇小学生82078207人,粪检蛔虫卵阳性数为人,粪检蛔虫卵阳性数为701701人,人,蛔虫感染率为蛔

    21、虫感染率为8.54%8.54%,乡村小学生,乡村小学生1458514585人,粪检蛔虫卵阳性数为人,粪检蛔虫卵阳性数为21672167人,蛔虫感染率为人,蛔虫感染率为14.86%14.86%,试比较该地小学生蛔虫感染率城乡差异有,试比较该地小学生蛔虫感染率城乡差异有无统计学意义。无统计学意义。1. 建立检验假设建立检验假设 H0: 1= 2,H1: 1 2, =0.052. 计算计算u值值 1258. 01458582072167701cP精40 确定确定P P值和判断结果值和判断结果 本题本题 =13.739=13.7392.582.58,P P0.01,0.01,按按 =0.05=0.05

    22、的水准拒绝的水准拒绝H H0 0,接受,接受H H1 1,差异有统计学意,差异有统计学意义。义。 3. 确定确定P值,判断结果值,判断结果0046. 0)14585182071)(1258. 01 (1258. 021PPS739.130046. 01486. 00854. 0uu精41 2检验检验 基本思想基本思想 四格表资料的卡方检验四格表资料的卡方检验 配对设计分类变量资料的卡方检验配对设计分类变量资料的卡方检验 行行列表资料的卡方检验列表资料的卡方检验精42 2检验(检验(Chi-square test)t 是现代统计学的创始人之一,英是现代统计学的创始人之一,英国统计学家国统计学家K

    23、.Pearson于于1900年提年提出的一种具有广泛用途的假设检验方出的一种具有广泛用途的假设检验方法。常用于分类变量资料的统计推断。法。常用于分类变量资料的统计推断。精43基本思想基本思想例例10-9 某医生欲比较用甲、乙两种药物治疗动脉硬化某医生欲比较用甲、乙两种药物治疗动脉硬化的疗效,甲药治疗的疗效,甲药治疗71例,有效例,有效52例,例, 乙药治疗乙药治疗42例,例,有效有效39例,结果见表例,结果见表10-7。问两种药物的有效率是否有。问两种药物的有效率是否有差别?差别?表表10-7 甲、乙两种药物治疗动脉硬化的疗效比较甲、乙两种药物治疗动脉硬化的疗效比较精44卡方检验的基本公式:卡

    24、方检验的基本公式:A:实际频数实际频数T:理论频数理论频数由上式可以看出,由上式可以看出,x2值反映的是在检验假设值反映的是在检验假设H0前提下实际频数与理论频数的吻合程度。前提下实际频数与理论频数的吻合程度。精45 2 2检验的自由度检验的自由度 指可以自由取值的基本格子数指可以自由取值的基本格子数 自由度一定时,其自由度一定时,其 2 2值的概率分布也就确定。根据自由值的概率分布也就确定。根据自由度度 和检验水准和检验水准 查表查表10-13 10-13 可得可得 2 2界值,若界值,若 2 2值值 2 20.050.05( ),),则可按则可按 =0.05=0.05的检验水准拒绝的检验水

    25、准拒绝H H0 0;若;若 2 2值值 2 20.050.05( ),),则还不能拒绝则还不能拒绝H H0 0。) 1)(1(列数行数精46四格表资料的卡方检验四格表资料的卡方检验四格表资料四格表资料处处 理理+-合合 计计Aaba+bBcdc+d合合 计计a+cb+dn(a+b+c+d)精47H0 :两药有效率相同,即:两药有效率相同,即 1 2H1 :两药有效率不同,即:两药有效率不同,即 1 2 =0.05(1) 建立检验假设,确定检验水准建立检验假设,确定检验水准例例10-9 10-9 甲、乙两种药物治疗动脉硬化的疗效比较甲、乙两种药物治疗动脉硬化的疗效比较精48 2 20 . 0 2

    26、 50 . 0 2 5 ( 1 1 )=5.02=5.02, 2 20 . 0 10 . 0 1 ( 1 1 )=6.63=6.63。本例。本例5.025.02 2 2=6.486.63=6.4840,Tmin548. 618. 818. 8382.3382.333982.1382.131918.5718.575222222精4922()()()()()adbcnab cd ac bd四格表专用公式:四格表专用公式:本例,本例,48. 622914271113)3919352(22精50校正公式:校正公式:22(0.5)ATT 22(/2)()()()()adbcnnab cd ac bd四格

    27、表资料四格表资料 2 2检验的校正检验的校正 分布是一种连续性分布,而分类变量资料属离散性分分布是一种连续性分布,而分类变量资料属离散性分布,由此得到的布,由此得到的 统计量也是不连续的。为改善统计量也是不连续的。为改善 2 2统计量分统计量分布的连续性,英国统计学家布的连续性,英国统计学家Yates F建议将实际频数和理论建议将实际频数和理论频数之差的绝对值减去频数之差的绝对值减去0.5以作校正。以作校正。精51例例10-10 10-10 某医生研究比较某医生研究比较A A、B B两种药物对急性细菌两种药物对急性细菌性肺炎的疗效,有关资料见表性肺炎的疗效,有关资料见表10-810-8,问两种

    28、药物的疗,问两种药物的疗效差别有无统计学意义?效差别有无统计学意义?表表10-8 A、B两药治疗急性细菌性肺炎的疗效比较两药治疗急性细菌性肺炎的疗效比较 精52H0: 1= 2H1: 1 2 =0.05 T22=22 8/64=2.75 5 按按 = 1= 1 , 查, 查 2 2值 表 ,值 表 , 2 20 . 0 50 . 0 5 ( 1 1 )= 3 . 8 4= 3 . 8 4 , 2 2=4.79=4.79 3.843.84,P P0.05, 0.05, 按按 =0.05=0.05水准,拒绝水准,拒绝H H0 0,接受接受H H1 1,认为两药的疗效差别有统计学意义,认为两药的疗效

    29、差别有统计学意义,A A药药疗效要好于疗效要好于B B药。药。 79. 48562242642/6416264022精53在实际工作中,对于四格表资料,通常规定在实际工作中,对于四格表资料,通常规定(1 1)T5T5,且,且N40N40时,直接计算值,不用校正;时,直接计算值,不用校正;(2 2)1T5, 1T5, 且且N40N40时,用连续性校正检验;时,用连续性校正检验;(3 3)T1T1或或N40N40,不能用卡方检验,用直接计算概率的方法。,不能用卡方检验,用直接计算概率的方法。精54配对设计分类变量资料的配对设计分类变量资料的 2 2检验检验 精5522()40,()bcbcbc22

    30、(1)40,()bcbcbc配对卡方检验又称配对卡方检验又称McNemar检验:检验: 精56例例10-11 10-11 用两种血清学方法对用两种血清学方法对100100例肝癌患者进行例肝癌患者进行检测,有关检测结果见表检测,有关检测结果见表10-910-9,问两种血清学方,问两种血清学方法检测结果有无差别?法检测结果有无差别?表表10-9 两种血清学方法对肝癌检测的结果比较两种血清学方法对肝癌检测的结果比较甲法甲法乙法乙法合计合计+-+503282-15 318合计合计6535100精57H0 :两种方法检出率相同,即:两种方法检出率相同,即B = CH1 :两种方法检出率两种方法检出率不同

    31、,即不同,即B C =0.05查表得,查表得,P 2 20.010.01(2 2), PP0.01, 0.01, 按按 =0.05=0.05的检验水准,拒绝的检验水准,拒绝H H0 0,接受接受H H1 1,故可认为甲、乙、丙三家医院院内感染率总的,故可认为甲、乙、丙三家医院院内感染率总的来讲有差别。来讲有差别。 精62例例10-13 10-13 某研究者欲了解白内障发病是否与某研究者欲了解白内障发病是否与ABOABO血血型有关,收集有关资料见表型有关,收集有关资料见表10-1110-11,问白内障组与,问白内障组与对照组对照组ABOABO血型分布有无差别?血型分布有无差别?精63H0 :白内

    32、障组与对照组:白内障组与对照组ABO血型分布相同血型分布相同H1 :白内障组与对照组白内障组与对照组ABO血型分布不同或不全相同血型分布不同或不全相同 =0.05查表得,查表得, 2 20.050.05(3 3)=7.81=7.81, 2 2 P0.05, 0.05, 按按 =0.05=0.05的检验水准,不拒绝检验假设,尚不能认为白的检验水准,不拒绝检验假设,尚不能认为白内障组与对照组内障组与对照组ABOABO血型分布不同。血型分布不同。 (1)(2)(3)25. 3122CRnnAn =(2-1)(4-1)=3 精64 理论数不宜太小。(不能有理论数不宜太小。(不能有1/51/5以上格子的

    33、理论频数小于以上格子的理论频数小于5 5或者有一个格子的理论频数小于或者有一个格子的理论频数小于1 1)。)。处理方法处理方法 如假设检验的结果是拒绝无效假设,只能认为各总体率或如假设检验的结果是拒绝无效假设,只能认为各总体率或构成比之间总的来说有差别。若要进一步了解哪两者之间构成比之间总的来说有差别。若要进一步了解哪两者之间有差别,可用卡方分割法,或者调整检验水准。有差别,可用卡方分割法,或者调整检验水准。 对于单向有序行列表,在比较各处理组的效应有无差别时,对于单向有序行列表,在比较各处理组的效应有无差别时,应该用秩和检验。应该用秩和检验。行行列表卡方检验的注意事项:列表卡方检验的注意事项

    34、:精65如:用某药治疗某病患者,如:用某药治疗某病患者,5例中有例中有3例治愈,计例治愈,计算治愈率为算治愈率为3/5100%=60.0%,如果有,如果有4例治愈,例治愈,则其治愈率为则其治愈率为80%。显然,这个结果是不稳定的。显然,这个结果是不稳定的。在分母例数很少的情况下,个别的偶然因素会导在分母例数很少的情况下,个别的偶然因素会导致结果的变化,只有分母例数较大时,计算的相致结果的变化,只有分母例数较大时,计算的相对数才比较稳定。在例数较少时,通常直接用绝对数才比较稳定。在例数较少时,通常直接用绝对数表示。如果要用相对数表示,则需列出其总对数表示。如果要用相对数表示,则需列出其总体率的置

    35、信区间。体率的置信区间。精66 某产院拟分析当地畸形儿与母亲分娩年龄的关系,检查了某产院拟分析当地畸形儿与母亲分娩年龄的关系,检查了新生儿新生儿44704470例,得以下资料,据此得出结论例,得以下资料,据此得出结论:“:“母亲年龄在母亲年龄在24242929岁时,畸形儿最多,占总数的岁时,畸形儿最多,占总数的92.2%92.2%,表明该年龄段易,表明该年龄段易发生畸形儿,符合一般规律发生畸形儿,符合一般规律”。试分析该结论是否合理?。试分析该结论是否合理?某地畸形儿与母亲分娩年龄的关系某地畸形儿与母亲分娩年龄的关系精67学学 生生检查检查人数人数阳性人数阳性人数检检出率(出率(%)阳性构成比

    36、阳性构成比(%)小学生小学生66060.915.41初中生初中生1115494.3944.14高中生高中生1563563.5850.45合合 计计33381113.33100.00表表10-1 200110-1 2001年某地中小学学生年某地中小学学生HBsAgHBsAg检出率及构成比检出率及构成比精68在进行率或构成比比较时,除了要比较的因素外,其他影在进行率或构成比比较时,除了要比较的因素外,其他影响的因素应基本一致。响的因素应基本一致。例如,分析比较两医院病死率的时,应注意两个医院的条例如,分析比较两医院病死率的时,应注意两个医院的条件应基本相同,如果上级医院的病死率高于基层医院的病件应

    37、基本相同,如果上级医院的病死率高于基层医院的病死率,并不能说明上级医院医疗水平不如基层医院,这是死率,并不能说明上级医院医疗水平不如基层医院,这是因为许多疑难病人均由基层医院转入上级医院所致。因为许多疑难病人均由基层医院转入上级医院所致。 精69当比较两个总率时,若其内部构成不同,当比较两个总率时,若其内部构成不同,需要进行率的标准化。需要进行率的标准化。 精70理论频数太小的理论频数太小的3 3种处理方法种处理方法1)增大样本含量,以达到增大理论频数的目的;增大样本含量,以达到增大理论频数的目的;2)删去理论频数太小的格子对应的行或列;删去理论频数太小的格子对应的行或列;3)合理合并:结合专业,将理论频数太小的行或合理合并:结合专业,将理论频数太小的行或列与性质相近的行或列合并。列与性质相近的行或列合并。( (黄陈平黄陈平 施红英施红英) )精71

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:分类变量资料的统计分析培训课件.ppt
    链接地址:https://www.163wenku.com/p-2532820.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库