独立性检验46744课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《独立性检验46744课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 独立性 检验 46744 课件
- 资源描述:
-
1、1.2 独立性检验的基本思想及其初步应用1.1.掌握掌握2 22 2列联表的独立性检验,能利用给出的数据列出列联列联表的独立性检验,能利用给出的数据列出列联表并会求表并会求K K2 2的观测值的观测值.2.2.了解独立性检验的基本思想和方法了解独立性检验的基本思想和方法.1.1.本节课的重点是理解独立性检验的基本思想及实施步骤本节课的重点是理解独立性检验的基本思想及实施步骤.2.2.本节课的难点是了解随机变量本节课的难点是了解随机变量K K2 2的含义和根据的含义和根据K K2 2的值得出结的值得出结论的意义论的意义.1.1.分类变量分类变量变量的不同变量的不同“值值”表示个体所属的,像这样的
2、变量表示个体所属的,像这样的变量称为分类变量称为分类变量.2.2.列联表列联表(1)(1)定义:列出的两个分类变量的,称为列联表定义:列出的两个分类变量的,称为列联表.不同类别不同类别频数表频数表(2)2(2)22 2列联表:列联表:一般地,假设两个分类变量一般地,假设两个分类变量X X和和Y Y,它们的取值分别为,它们的取值分别为xx1 1,x,x2 2 和和yy1 1,y,y2 2,其样本频数列联表其样本频数列联表(称称2 22 2列联表列联表)为为y y1 1y y2 2总计总计x x1 1a ab ba+ba+bx x2 2c cd dc+dc+d总计总计a+ca+cb+db+da+b
3、+c+da+b+c+d3.3.独立性检验独立性检验(1)(1)定义:利用随机变量定义:利用随机变量K K2 2来判断来判断“两个分类变量有关系两个分类变量有关系”的的方法称为两个分类变量的独立性检验方法称为两个分类变量的独立性检验.(2)(2)公式:公式:K K2 2其中其中n=n=.2n(adbc)(ab)(cd)(ac)(bd)a+b+c+da+b+c+d1.1.在独立性检验中,计算得在独立性检验中,计算得k=29.78,k=29.78,在判断变量相关时,在判断变量相关时,P(KP(K2 26.635)0.016.635)0.01的含义是什么?的含义是什么?提示:提示:P(KP(K2 26
4、.635)0.016.635)0.01的含义是在犯错误的概率不超过的含义是在犯错误的概率不超过0.010.01的前提下认为两个变量相关的前提下认为两个变量相关.2.2.列联表中列联表中ad-bcad-bc的值与两个分类变量之间相关的强弱有的值与两个分类变量之间相关的强弱有什么关系?什么关系?提示:提示:在列联表中,若两个分类变量没有关系,则在列联表中,若两个分类变量没有关系,则|ad-bc|ad-bc|00,所以,所以ad-bcad-bc的值越小,两个分类变量之间的关系越的值越小,两个分类变量之间的关系越弱;弱;ad-bcad-bc的值越大,两个分类变量之间的关系越强的值越大,两个分类变量之间
5、的关系越强.3.3.作散点图的主要目的是作散点图的主要目的是.【解析】【解析】散点图可以形象地展示两个变量之间的关系,所以它散点图可以形象地展示两个变量之间的关系,所以它的主要目的就是直观了解两个变量之间的关系的主要目的就是直观了解两个变量之间的关系.答案:答案:直观了解两个变量之间的关系直观了解两个变量之间的关系4.4.若由一个若由一个2 22 2列联表中的数据计算得列联表中的数据计算得K K2 2的观测值的观测值k=4.013,k=4.013,则则认为认为“两个变量有关系两个变量有关系”犯错误的概率不超过犯错误的概率不超过.【解析】【解析】P(KP(K2 23.841)0.053.841)
6、0.05,认为认为“两个变量有关系两个变量有关系”犯错误的概率不超过犯错误的概率不超过0.05.0.05.答案:答案:0.050.051.1.对于对于“分类变量分类变量”的理解的理解(1)(1)这里的这里的“变量变量”和和“值值”都应作为都应作为“广义广义”的变量和值进的变量和值进行理解行理解.例如,对于性别变量,其取值为男和女两种例如,对于性别变量,其取值为男和女两种.那么这里那么这里的变量指的是性别,同样这里的的变量指的是性别,同样这里的“值值”指的是指的是“男男”和和“女女”.因此,这里所说的因此,这里所说的“变量变量”和和“值值”不一定取的是具体的数值不一定取的是具体的数值.2.2.独
7、立性检验与反证法的异同点独立性检验与反证法的异同点独立性检验的思想来自于统计学的假设检验思想,它与反证法独立性检验的思想来自于统计学的假设检验思想,它与反证法类似,假设检验和反证法都是先假设结论不成立,然后根据是类似,假设检验和反证法都是先假设结论不成立,然后根据是否能够推出否能够推出“矛盾矛盾”来断定结论是否成立来断定结论是否成立.但二者但二者“矛盾矛盾”的的含义不同,反证法中的含义不同,反证法中的“矛盾矛盾”是指不符合逻辑的事件的发生;是指不符合逻辑的事件的发生;而假设检验中的而假设检验中的“矛盾矛盾”是指不符合逻辑的小概率事件的发生,是指不符合逻辑的小概率事件的发生,即在结论不成立的假设
8、下,推出利用结论成立的小概率事件的即在结论不成立的假设下,推出利用结论成立的小概率事件的发生发生.3.3.判断两个分类变量是否有关系的两种方法比较判断两个分类变量是否有关系的两种方法比较判断两个分类变量是否有关系的两种方法是:等高条形图和独判断两个分类变量是否有关系的两种方法是:等高条形图和独立性检验立性检验.(1)(1)通过等高条形图,可以粗略地判断两个分类变量是否有关通过等高条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度系,但是这种判断无法精确地给出所得结论的可靠程度.(2)(2)利用独立性检验来判断两个分类变量是否有关系,能够精利用独立性检验来
9、判断两个分类变量是否有关系,能够精确地给出这种判断的可靠程度,也常与图形分析法结合确地给出这种判断的可靠程度,也常与图形分析法结合.等高条形图的应用等高条形图的应用【技法点拨】【技法点拨】1.1.判断两个分类变量是否有关系的两个常用方法判断两个分类变量是否有关系的两个常用方法(1)(1)利用数形结合思想,借助等高条形图来判断两个分类变量利用数形结合思想,借助等高条形图来判断两个分类变量是否相关是判断变量相关的常见方法是否相关是判断变量相关的常见方法.(2)(2)一般地,在等高条形图中,与一般地,在等高条形图中,与 相差越大,两个分相差越大,两个分类变量有关系的可能性就越大类变量有关系的可能性就
10、越大.aabccd2.2.利用等高条形图判断两个分类变量是否相关的步骤利用等高条形图判断两个分类变量是否相关的步骤【典例训练】【典例训练】1.1.从发生交通事故的司机中抽取从发生交通事故的司机中抽取2 0002 000名司机作随机样本,根据名司机作随机样本,根据他们血液中是否含有酒精以及他们是否对事故负有责任将数据他们血液中是否含有酒精以及他们是否对事故负有责任将数据整理如下:整理如下:有责任有责任无责任无责任总计总计有酒精有酒精650650150150800800无酒精无酒精7007005005001 2001 200总计总计1 3501 3506506502 0002 000相应的等高条形
11、图如图所示相应的等高条形图如图所示.试结合等高条形图分析血液中含试结合等高条形图分析血液中含有酒精与对事故负有责任是否有关系有酒精与对事故负有责任是否有关系.2.2.某学校对高三学生进行了一项调查发现:在平时的模拟考试某学校对高三学生进行了一项调查发现:在平时的模拟考试中,性格内向的学生中,性格内向的学生426426人中有人中有332332人在考前心情紧张,性格外人在考前心情紧张,性格外向的学生向的学生594594人中有人中有213213人在考前心情紧张人在考前心情紧张.作出等高条形图,作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系利用图形判断考前心情紧张与性格类别是否有关系.【
12、解析】【解析】1.1.比较来说,两者差距较大,在比较来说,两者差距较大,在“有酒精有酒精”和和“无酒无酒精精”两个矩形中,阴影部分的面积不同,由此可以看出在某种两个矩形中,阴影部分的面积不同,由此可以看出在某种程度上认为血液中含有酒精与对事故负有责任有关系程度上认为血液中含有酒精与对事故负有责任有关系.2.2.作列联表如下:作列联表如下:性格内向性格内向性格外向性格外向总计总计考前心情紧张考前心情紧张332332213213545545考前心情不紧张考前心情不紧张9494381381475475总计总计4264265945941 0201 020相应的等高条形图如图所示,相应的等高条形图如图所
13、示,图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例,从图中可以看出,考前紧张的样本中性格内向占的比的比例,从图中可以看出,考前紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考例比考前心情不紧张样本中性格内向占的比例高,可以认为考前紧张与性格类型有关前紧张与性格类型有关.【归纳】【归纳】等高条形图的作法及作用小结等高条形图的作法及作用小结.提示提示:1.1.首先作首先作2 22 2列联表,注意对涉及的变量分清类别列联表,注意对涉及的变量分清类别;其次其次要注意计算的准确性要注意计算的准确性;第三画
14、等高条形图,注意各变量的顺序第三画等高条形图,注意各变量的顺序与所画位置与所画位置.2.2.通过等高条形图可以粗略地判断两个分类变量是否有关系,通过等高条形图可以粗略地判断两个分类变量是否有关系,但无法精确地给出所得结论的可靠程度但无法精确地给出所得结论的可靠程度.【变式训练】【变式训练】为了了解铅中毒病人是否有尿棕色素增加现象,为了了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组的尿液做尿棕色素定性检查,结果如下分别对病人组和对照组的尿液做尿棕色素定性检查,结果如下表,问铅中毒病人组和对照组的尿棕色素阳性数有无差别?表,问铅中毒病人组和对照组的尿棕色素阳性数有无差别?组别组别阳性数
15、阳性数 阴性数阴性数总计总计铅中毒铅中毒病人组病人组29297 73636对照组对照组9 928283737总计总计383835357373【解析】【解析】根据列联表作出等高条形图根据列联表作出等高条形图(如图如图).).由图形可知,铅由图形可知,铅中毒病人组与对照组相比较,尿棕色素为阳性差异明显,因此中毒病人组与对照组相比较,尿棕色素为阳性差异明显,因此铅中毒病人与尿棕色素为阳性存在相关关系铅中毒病人与尿棕色素为阳性存在相关关系.独立性检验独立性检验【技法点拨】【技法点拨】解决一般的独立性检验问题的步骤解决一般的独立性检验问题的步骤【典例训练】【典例训练】1.(20121.(2012武汉高二
16、检测武汉高二检测)在独立性检验中,若随机变量在独立性检验中,若随机变量K K2 2的观的观测值测值k6.635k6.635,则,则()()(A)X(A)X与与Y Y有关系,犯错的概率不超过有关系,犯错的概率不超过1%1%(B)X(B)X与与Y Y有关系,犯错的概率超过有关系,犯错的概率超过1%1%(C)X(C)X与与Y Y没有关系,犯错的概率不超过没有关系,犯错的概率不超过1%1%(D)X(D)X与与Y Y没有关系,犯错的概率超过没有关系,犯错的概率超过1%1%2.(20122.(2012厦门高二检测厦门高二检测)在对人们休闲方式的一次调查中,共在对人们休闲方式的一次调查中,共调查调查1201
17、20人,其中女性人,其中女性7070人、男性人、男性5050人人.女性中有女性中有4040人主要的休人主要的休闲方式是看电视,另外闲方式是看电视,另外3030人主要的休闲方式是运动;男性中有人主要的休闲方式是运动;男性中有2020人主要的休闲方式是看电视,另外人主要的休闲方式是看电视,另外3030人主要的休闲方式是运人主要的休闲方式是运动动.(1)(1)根据以上数据建立一个根据以上数据建立一个2 22 2的列联表;的列联表;(2)(2)休闲方式与性别是否有关?休闲方式与性别是否有关?【解析】【解析】1.1.选选A.k6.635.A.k6.635.说明两个变量说明两个变量X X与与Y Y有关系,
18、这种有关系,这种说法犯错误的概率不超过说法犯错误的概率不超过0.010.01,即,即1%1%,故选,故选A.A.2.(1)22.(1)2的列联表为的列联表为 性性 别别 看电视看电视运动运动总计总计女性女性404030 30 7070男性男性202030305050总计总计60606060120 120 休休 闲闲 方方 式式(2)(2)计算计算K K2 2的观测值为的观测值为而而2.7062.7063.4293.4293.841,3.841,因为因为P(KP(K2 22.706)0.10,P(K2.706)0.10,P(K2 23.841)0.05,3.841)0.05,所以,在犯错误的概率
19、不超过所以,在犯错误的概率不超过0.100.10的前提下,认为休闲方式与的前提下,认为休闲方式与性别有关性别有关.2120(40 3020 30)24k3.429.70 50 60 607【互动探究】【互动探究】本题条件不变的情况下,画出等高条形图本题条件不变的情况下,画出等高条形图.【解析】【解析】【思考】【思考】1.1.求求k k的值的关键是什么?的值的关键是什么?2.k2.k的大小对的大小对“两个变量有关两个变量有关”有什么影响?有什么影响?提示提示:1.1.求求K K2 2的观测值的观测值k k的关键是要准确列出的关键是要准确列出2 22 2列联表,即找列联表,即找准表达式中的各个量的
20、数值准表达式中的各个量的数值.2.2.利用利用K K2 2的观测值进行独立性检验可以精确地给出这种判断的的观测值进行独立性检验可以精确地给出这种判断的可靠程度,而且可靠程度,而且k k的值越大,说明的值越大,说明“X X与与Y Y有关系有关系”成立的可能成立的可能性越大性越大.【变式训练】【变式训练】(2012(2012琼海高二检测琼海高二检测)为了调查某地区老年人是为了调查某地区老年人是否需要志愿者帮助,用简单随机抽样方法从该地区调查了否需要志愿者帮助,用简单随机抽样方法从该地区调查了500500位老年人,结果如下:位老年人,结果如下:是否需要帮助是否需要帮助男男女女总计总计需要需要4040
展开阅读全文