书签 分享 收藏 举报 版权申诉 / 23
上传文档赚钱

类型凤中课件独立性检验的基本思想及其初步应用.ppt03.ppt

  • 上传人(卖家):三亚风情
  • 文档编号:2810453
  • 上传时间:2022-05-28
  • 格式:PPT
  • 页数:23
  • 大小:1.28MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《凤中课件独立性检验的基本思想及其初步应用.ppt03.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    课件 独立性 检验 基本 思想 及其 初步 应用 ppt03
    资源描述:

    1、为了调查吸烟是否对患肺癌有影响,某肿瘤研究所随为了调查吸烟是否对患肺癌有影响,某肿瘤研究所随机的调查了机的调查了9965人,得到结果如下(单位:人)人,得到结果如下(单位:人)列联表:列联表:不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟7775427817吸烟吸烟2099492148总计总计9874919965那么吸烟是否会患肺癌有影响?那么吸烟是否会患肺癌有影响?列联表与柱形图、条形图列联表与柱形图、条形图为了研究患慢性支气管炎与吸烟量的关系调查了为了研究患慢性支气管炎与吸烟量的关系调查了228人,其中每天吸烟在人,其中每天吸烟在10支以上支以上20支以下的调查支以下的调查者中,患者人数

    2、有者中,患者人数有98人,非患者人数有人,非患者人数有89人;每人;每天吸烟支数在天吸烟支数在20支以上的调查者中,患者人数有支以上的调查者中,患者人数有25人,非患者人数有人,非患者人数有16人。试画出列联表以及二人。试画出列联表以及二维条形图与三维柱形图。维条形图与三维柱形图。不患病不患病患病患病总计总计10-20支支899818720支以上支以上162541总计总计105123228020406080100120不患病患病20支以上10-20支02040608010012014016018020020支以上10-20支患病不患病0%10%20%30%40%50%60%70%80%90%1

    3、00%20支以上10-20支患病不患病某企业为了考察同一种产品在甲、乙两条生产线的某企业为了考察同一种产品在甲、乙两条生产线的产品合格率,同时各抽取产品合格率,同时各抽取100件产品,其中甲线中件产品,其中甲线中合格产品的个数为合格产品的个数为97,乙线中合格产品的个数为,乙线中合格产品的个数为95。请做出列联表,三维柱形图与二维条形图。请做出列联表,三维柱形图与二维条形图。020406080100120合格不合格乙线甲线9293949596979899100101乙线甲线不合格合格92%93%94%95%96%97%98%99%100%乙线甲线不合格合格不患肺癌不患肺癌患肺癌患肺癌总计总计不

    4、吸烟不吸烟aba+b吸烟吸烟cdc+d总计总计a+cb+da+b+c+d假设吸烟与患肺癌没有关系,那么吸烟者中不患肺癌假设吸烟与患肺癌没有关系,那么吸烟者中不患肺癌的比例应该与不吸烟者中相应的比例差不多即的比例应该与不吸烟者中相应的比例差不多即()()0aca cdc ababcdadbcadbcadbc 即 因此越小说明吸烟与患肺癌之间关系越弱;因此越大说明吸烟与患肺癌之间关系越强。0H假设:吸烟与患肺癌没有关系22()()()()()n ad bca b c d a c b d为了是不同样本容量的数据有一个统一的标准,构造一个随即变量(a,b,c,d均必须大于5)K,其中n=a+b+c+d

    5、为样本容量2000HKkkk在假设成立的前提下,的观测值 应该比较小因此,当 很小时,说明在一定的可信程度上H 成立;很大时,说明没有充分的证据说明H 成立。k k大小的标准是什么呢?大小的标准是什么呢?0k临界值20002000当kk 时,含义是有(1-P(K k ))100%的把握说明H 不成立,而这种判断可能出错,出错的概率不会超过P(K k )当kk 时,含义是样本数据没有充分的理由证明H不成立独立性检验独立性检验首先,假设结论不成立,即首先,假设结论不成立,即 H :两个分类变量没有关系:两个分类变量没有关系 (在这种假设下(在这种假设下k应该很小)应该很小)其次,由观测数据计算其次

    6、,由观测数据计算K 的观测值的观测值k, (如果(如果k很大,则在一定可信程度上说明很大,则在一定可信程度上说明H 不成不成 立立,即两个分类变量之间有关系)即两个分类变量之间有关系)最后,根据最后,根据k的值判断假设是否成立的值判断假设是否成立2临界值表:0.500.400.250.150.100.050.0250.0100.0050.0010.4450.7081.3232.0722.7063.8415.0246.6357.87910.82820()P Kk0k02220:9965(7775 4942 2099)56.6327817 2148 9874 91(10.828)0.00156.6

    7、31KP K解:假设H吸烟与患肺癌没有关系的观测值为k根据临界值表可知远大于10.828,所以有理由判断H 不成立,所以吸烟与患癌症有关系。这种判断可能有错误,但是犯错误的不会超过这种判断可能有错误,但是犯错误的不会超过0.001,这是个小概率时间,我们有,这是个小概率时间,我们有99.9%的把的把握认为握认为“吸烟与患癌症有关系吸烟与患癌症有关系”在吸烟与患肺病这两个分类变量的计算中,下列说法正确在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是(的是( )A、若、若K的观测值为的观测值为k=6.635,我们有我们有99%的把握认为吸烟与患的把握认为吸烟与患肺病有关系,那么在肺病有关系,

    8、那么在100个吸烟的人中必有个吸烟的人中必有99个患肺病个患肺病B、从独立性检验可知有、从独立性检验可知有99%的把握认为吸烟与患肺病有关的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有系时,我们说某人吸烟,那么他有99%的可能患肺病的可能患肺病C、若从统计量中求出有、若从统计量中求出有95%的把握认为吸烟与患肺病有关的把握认为吸烟与患肺病有关系,是指有系,是指有5%的可能性使得推理出现错误的可能性使得推理出现错误D、以上三种说法都不对、以上三种说法都不对c1、理解分类变量,会作列联表及三、理解分类变量,会作列联表及三维柱形图与二维条形图维柱形图与二维条形图2、了解独立性检验的思想、了

    9、解独立性检验的思想能否从列联表的三维柱形图与二维条形能否从列联表的三维柱形图与二维条形图中估计出两个分类变量是否相关吗?图中估计出两个分类变量是否相关吗?总计总计aba+bcdc+d总计总计a+cb+da+b+c+d1x2x1y2y1212 , ,XYx xy y假设有两个分类变量 和 ,他们可能的取值分别为其样本频数列联表为:11HXYH: 与 有关系 判断成立的可能性11adbcHacHabcd在三维柱形图中,与相差的越大,成立的可能性就越大在二维柱形图中,与相差的越大,成立的可能性就越大1、通过图形,大致地判断两个分类变量是否有关系、通过图形,大致地判断两个分类变量是否有关系022001

    10、1.,abkckk根据实际问题需要的可信程度确定临界值k根据观测数据计算随机变量K的值如果就以(1-P(Kk ))100%的把握认为H成立,否则认为由样本数据没有充分的证据显示H成立2、利用独立相关性检验来考察两个分类变量是、利用独立相关性检验来考察两个分类变量是否有关系,并且精确地给出这种判断的可靠程度。否有关系,并且精确地给出这种判断的可靠程度。具体步骤如下:具体步骤如下:在某医院,因为患心脏病而住院的在某医院,因为患心脏病而住院的665名男性病人名男性病人中,有中,有214人秃顶,而另外人秃顶,而另外772名不是因为患心脏病名不是因为患心脏病而住院的男性病人中有而住院的男性病人中有175

    11、人秃顶。利用图形判断人秃顶。利用图形判断秃顶与患心脏病是否有关系。能够以秃顶与患心脏病是否有关系。能够以99%的把握认的把握认为秃顶与患心脏病有关系吗?为什么?为秃顶与患心脏病有关系吗?为什么?例1患心脏病患心脏病换其他病换其他病总计总计秃顶秃顶214175389不秃顶不秃顶4515971048总计总计6657721437 底面副对角线上两个柱体高度的乘积要大一些,因底面副对角线上两个柱体高度的乘积要大一些,因此可以在某种程度上认为此可以在某种程度上认为“秃顶与患心脏病有关秃顶与患心脏病有关”21437 (214 597 175 451)16.3736.635389 1048 665 772k

    12、所以有所以有99%的把握认为的把握认为“秃顶与患心脏病有关秃顶与患心脏病有关”因为这组数据来因为这组数据来自被调查的医院,自被调查的医院,因此此结论只是因此此结论只是用于该医院住院用于该医院住院的病人群体的病人群体例例2 为了考察高中生的性别与是否喜欢数学课为了考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随即程之间的关系,在某城市的某校高中生中随即抽取抽取300名学生,得到如下列联表:名学生,得到如下列联表:由表中数据计算得到由表中数据计算得到 的观测值的观测值 。能够以能够以95%的把握认为高中生的性别与是否喜欢的把握认为高中生的性别与是否喜欢数学课程之间有关系吗?为

    13、什么?数学课程之间有关系吗?为什么?喜欢数学课程喜欢数学课程不喜欢数学课程不喜欢数学课程总计总计男男3785122女女35143178总计总计722283002K4.514k 222(3.841)0.054.5143.841P KKk解:在假设“性别与是否喜欢数学之间没有关系”的前提下,K 应该很小,并且 而 的观测值超过了,这就意味着“性别与是否喜欢数学课程之间有关系”这一结论是错误的可能性约为0.05,即有95%的把握认为“性别与是否喜欢数学课程之间有关系”这一结论只适用于被调查的学校这一结论只适用于被调查的学校在研究某种新措施对猪白痢的防治效果问题时,在研究某种新措施对猪白痢的防治效果问题时,得到以下数据:得到以下数据:试问新措施对防止猪白痢是否有效?试问新措施对防止猪白痢是否有效?存活率存活率死亡率死亡率合计合计对照对照11436150新措施新措施13218150合计合计246543001、能够通过三维柱形图与二维条形图估计、能够通过三维柱形图与二维条形图估计两个分类变量之间是否有关系两个分类变量之间是否有关系2、利用、利用 判断处两个分类变量之间是否有判断处两个分类变量之间是否有关系关系3、了解独立性检验的思想、了解独立性检验的思想2K

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:凤中课件独立性检验的基本思想及其初步应用.ppt03.ppt
    链接地址:https://www.163wenku.com/p-2810453.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库