统计学基础第九章课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《统计学基础第九章课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 基础 第九 课件
- 资源描述:
-
1、第九章假设检验第一节第一节 假设检验的一般问题假设检验的一般问题第二节第二节 单总体参数的假设检验单总体参数的假设检验本章内容本章内容第一节假设检验的一般问题 假设检验(假设检验(hypothesis texthypothesis text)是先对总体参数提出某种)是先对总体参数提出某种假设,然后进行随机抽样,并根据样本的信息来验证该假假设,然后进行随机抽样,并根据样本的信息来验证该假设是否成立。设是否成立。假设检验可分为参数检验和非参数检验两种。参数检假设检验可分为参数检验和非参数检验两种。参数检验是对总体的参数进行检验,可进一步区分为单总体参数验是对总体的参数进行检验,可进一步区分为单总体
2、参数检验和多总体参数检验。而非参数检验是对总体的分布形检验和多总体参数检验。而非参数检验是对总体的分布形式、随机变量独立性等方面进行检验。式、随机变量独立性等方面进行检验。本章只讨论单总体均值、比例、方差等参数的检验。本章只讨论单总体均值、比例、方差等参数的检验。一、假设检验的一般原理一、假设检验的一般原理 假设检验的依据是小概率原理:在一个已知假设下,如假设检验的依据是小概率原理:在一个已知假设下,如果某个事件发生的概率非常小,我们通常认为,这个假设可果某个事件发生的概率非常小,我们通常认为,这个假设可能是不成立的。能是不成立的。小概率原理是对人们日常思维习惯的抽象概括。在日常小概率原理是对
3、人们日常思维习惯的抽象概括。在日常生活中,人们习惯于把概率非常小的事件,当作在一次观察生活中,人们习惯于把概率非常小的事件,当作在一次观察中是不可能出现的事件。当然,如果我们认为某个事件是小中是不可能出现的事件。当然,如果我们认为某个事件是小概率事件,但在一次观察中却发生了,合理的解释自然是我概率事件,但在一次观察中却发生了,合理的解释自然是我们原来的看法有问题,也就是说,我们原来认定的事件可能们原来的看法有问题,也就是说,我们原来认定的事件可能并不是小概率事件。并不是小概率事件。例例1 1:ProCareProCare Industries Industries,Ltd.Ltd.曾经提供了一
4、种称为曾经提供了一种称为“性别选择性别选择”的产品,的产品,根据广告上的说法,这种产品可以使夫妇根据广告上的说法,这种产品可以使夫妇“将生一个男孩的概率增加到将生一个男孩的概率增加到8585,生一个女孩的概率增加到,生一个女孩的概率增加到8080。”对于想要男孩的夫妇,对于想要男孩的夫妇,“性别选择性别选择”就装在一个蓝色的包装里,对于想要女孩的夫妇,就装在一个蓝色的包装里,对于想要女孩的夫妇,“性别选择性别选择”就装在一就装在一个粉色的包装里。假设我们对个粉色的包装里。假设我们对100100对想要女孩的夫妇进行了一项实验,他们对想要女孩的夫妇进行了一项实验,他们都遵照了在都遵照了在“性别选择
5、性别选择”粉色包装上描述的粉色包装上描述的“户内方便使用说明户内方便使用说明”。使用。使用常识和非正规统计学方法来判断,如果常识和非正规统计学方法来判断,如果100100个婴儿中包含以下数量的女孩,个婴儿中包含以下数量的女孩,我们应该对我们应该对“性别选择性别选择”的有效性得出什么结论?的有效性得出什么结论?5252个女孩个女孩 9797个女孩个女孩答:答:在在100100个婴儿中,正常情况下会有大约个婴儿中,正常情况下会有大约5050个女孩。个女孩。5252个个女孩的结果接近于女孩的结果接近于5050,因此我们不应该认为,因此我们不应该认为“性别选择性别选择”产产品是有效的。即使品是有效的。
6、即使100100对夫妇没有使用任何特殊的性别选择方对夫妇没有使用任何特殊的性别选择方法,法,5252个女孩这个结果也可能很容易地发生。个女孩这个结果也可能很容易地发生。在在100100个新生儿中有个新生儿中有9797个是女孩这个结果在偶然的情况个是女孩这个结果在偶然的情况下是非常不可能发生的。我们可以用两种方式来解释出现下是非常不可能发生的。我们可以用两种方式来解释出现9797个女孩这一现象:要么是极其罕见的事件偶然出现了,要么个女孩这一现象:要么是极其罕见的事件偶然出现了,要么是是“性别选择性别选择”产品是有效的。因为出现产品是有效的。因为出现9797个女孩的概率极个女孩的概率极低,所以更有
7、可能的解释就是这种产品是有效的。低,所以更有可能的解释就是这种产品是有效的。理解了小概率原理,就理解了假设检验的思想:首先对总理解了小概率原理,就理解了假设检验的思想:首先对总体参数建立某种假设(称为原假设)体参数建立某种假设(称为原假设)H H0 0,然后经过随机抽样取,然后经过随机抽样取得一组样本数据,如果根据样本数据计算的某个统计量(或得一组样本数据,如果根据样本数据计算的某个统计量(或多个统计量)在原假设多个统计量)在原假设H H0 0成立的条件下发生的概率很小,就拒成立的条件下发生的概率很小,就拒绝或否定这个原假设并继而接受其对立面绝或否定这个原假设并继而接受其对立面备择假设。反备择
8、假设。反之,如果该统计量在原假设之,如果该统计量在原假设H H0 0成立的条件下发生的可能性不是成立的条件下发生的可能性不是很小,那么就接受原假设。很小,那么就接受原假设。例例2 2:假设某种饮料的商标上标明的容量为:假设某种饮料的商标上标明的容量为250250毫升,标准毫升,标准差为差为4 4毫升。如果你从市场上随机抽取毫升。如果你从市场上随机抽取5050瓶,发现其平均含瓶,发现其平均含量为量为248248毫升。据此,可否断定饮料厂商欺骗了消费者?毫升。据此,可否断定饮料厂商欺骗了消费者?分析:样本平均含量低于厂商声称的平均含量,其原因不分析:样本平均含量低于厂商声称的平均含量,其原因不外乎
9、有两种:一是由抽样误差引起的。如果样本平均数与总外乎有两种:一是由抽样误差引起的。如果样本平均数与总体平均数之差不大,未超出抽样误差范围,则可认为两者之体平均数之差不大,未超出抽样误差范围,则可认为两者之差就是由抽样误差引起的,饮料厂商不存在欺诈行为。二是差就是由抽样误差引起的,饮料厂商不存在欺诈行为。二是由饮料厂商短斤少两引起的,即饮料厂商存在欺诈行为。在由饮料厂商短斤少两引起的,即饮料厂商存在欺诈行为。在这种情况下,样本平均数与总体平均数之差就会超出抽样误这种情况下,样本平均数与总体平均数之差就会超出抽样误差范围,因为其差异是厂商的有意行为。差范围,因为其差异是厂商的有意行为。抽样误差范围
10、是与概率保证程度相联系的。对于正态分布抽样误差范围是与概率保证程度相联系的。对于正态分布总体,若取概率保证程度为总体,若取概率保证程度为99%,则样本平均数与总体平均,则样本平均数与总体平均数数之差大于抽样平均误差的之差大于抽样平均误差的2.33倍,即,也就是说,或发倍,即,也就是说,或发生的概率只有生的概率只有1%(见图(见图9-1)。因此,是一个小概率事件,)。因此,是一个小概率事件,这一事件在这一事件在100次抽样中只发生一次,而对于一次抽样而言,次抽样中只发生一次,而对于一次抽样而言,可认为小概率事件实际上不会发生。可认为小概率事件实际上不会发生。图图9-1 1%9-1 1%概率示意图
11、(概率示意图(=0.01=0.01)解解:在本例中,在本例中,=248=248,=4=4,n=50n=50,假设,假设=250=250也就是说,对于一次抽样的结果,小概率事件发生了,也就是说,对于一次抽样的结果,小概率事件发生了,这是不合常理的,所以可认为总体平均数这是不合常理的,所以可认为总体平均数250250这一这一假设不成立,即该包装饮料的容量不足假设不成立,即该包装饮料的容量不足250250毫升,厂商毫升,厂商有欺诈故意。有欺诈故意。x 二、假设检验的步骤二、假设检验的步骤 1 1建立假设建立假设 2 2选择检验统计量及其分布选择检验统计量及其分布 3 3确定显著性水平、临界值、接受域
12、、拒绝域,计确定显著性水平、临界值、接受域、拒绝域,计算检验统计量的值,检验原假设是否成立。算检验统计量的值,检验原假设是否成立。建立假设应注意的问题建立假设应注意的问题检验统计量的选择检验统计量的选择检验原假设是否成立检验原假设是否成立三、两类错误三、两类错误 假设检验容易犯两类错误:假设检验容易犯两类错误:第一类错误(第一类错误(tape error tape error),即),即“弃真的错误弃真的错误”,是指根据小概率原理,当原假设真时拒绝原假设而犯的错误。是指根据小概率原理,当原假设真时拒绝原假设而犯的错误。犯第一类错误的概率为犯第一类错误的概率为,即显著性水平。,即显著性水平。第二
13、类错误(第二类错误(tape error tape error),即),即“纳伪的错误纳伪的错误”,是指原假设假时没有拒绝原假设所犯的错误是指原假设假时没有拒绝原假设所犯的错误 。犯第二类错误。犯第二类错误的概率记为的概率记为。应当注意:应当注意:只有当原假设被拒绝时,才会犯第一类错误;只有当原假设被拒绝时,才会犯第一类错误;只有当原假设未被拒绝时,才会犯第二类错误。只有当原假设未被拒绝时,才会犯第二类错误。决策结果决策结果实际情况实际情况原假设原假设H H0 0真真原假设原假设H H0 0假假未拒绝未拒绝H H0 0正确决策正确决策第二类错误第二类错误拒绝拒绝H H0 0第一类错误第一类错误
14、正确决策正确决策 两类错误的概率两类错误的概率和和存在着一定的关系:存在着一定的关系:增大,则增大,则减减小;小;减小,则减小,则增大。我们当然希望犯这两类错误的概率都增大。我们当然希望犯这两类错误的概率都尽可能的小,但实际上很难做到,唯一的办法是扩大样本容尽可能的小,但实际上很难做到,唯一的办法是扩大样本容量,但扩大样本容量又受到各种因素的限制,因此我们往往量,但扩大样本容量又受到各种因素的限制,因此我们往往是在两类错误之间进行平衡,以使是在两类错误之间进行平衡,以使和和控制在能够接受的范控制在能够接受的范围内。围内。例例3 3:某研究机构估计,某地大学生中手机保有率(大学生:某研究机构估计
15、,某地大学生中手机保有率(大学生中拥有手机的比率)超过中拥有手机的比率)超过8080。为验证这一估计是否正确,该。为验证这一估计是否正确,该机构拟在该地大学生中抽取样本进行检验。机构拟在该地大学生中抽取样本进行检验。建立的假设为:建立的假设为:原假设原假设H H0 0:8080 备择假设备择假设H H1 1:8080 试描述第一类错误和第二类错误的含义。试描述第一类错误和第二类错误的含义。解:第一类错误意味着:该地大学生中手机实际保有率不解:第一类错误意味着:该地大学生中手机实际保有率不到到8080,但样本结果却拒绝了原假设,认为大学生手机保有率,但样本结果却拒绝了原假设,认为大学生手机保有率
16、超过了超过了8080。第二类错误意味着:该地大学生手机实际保有率超过了第二类错误意味着:该地大学生手机实际保有率超过了8080,但样本结果却接受了原假设,认为大学生手机保有率不到,但样本结果却接受了原假设,认为大学生手机保有率不到8080。四、利用四、利用P P值进行假设检验值进行假设检验 在原假设成立的条件下,检验统计量在某样本中至少达到在原假设成立的条件下,检验统计量在某样本中至少达到相应值的概率称为相应值的概率称为P P值(值(P-valueP-value)。)。双侧检验:双侧检验:H H0 0:0 0H H1 1:0 0P P值值 0CZZP2左侧检验:左侧检验:H H0 0:0 0H
17、 H1 1:0 0 P P值值=0ZPcZ右侧检验:右侧检验:H H0 0:0 0H H1 1:0 0 P P值值=0ZPcZ根据根据P P值进行假设检验:值进行假设检验:通过样本观察数据计算检验统计量的值,查表得到该通过样本观察数据计算检验统计量的值,查表得到该统计量值的概率即统计量值的概率即P P值,然后将值,然后将P P值与所给的显著性水平值与所给的显著性水平对比,如果对比,如果P P值小于值小于,则拒绝原假设;如果,则拒绝原假设;如果P P值大于值大于,则接受原假设。则接受原假设。第二节单总体参数的假设检验 (一)总体满足正态分布(一)总体满足正态分布N N(,2 2),且方差),且方
18、差2 2已知,已知,小样本(小样本(n n3030)时,统计量)时,统计量1,0nxZN于是,总体均值于是,总体均值的检验方法可的检验方法可 采取采取Z Z检验法。检验法。原假设:原假设:H H0 0:0 0备择假设:备择假设:H H1 1:0 0检验统计量:检验统计量:N(0,1)nxZ0拒绝域:拒绝域:2ZZ双侧检验双侧检验例例4 4:根据长期经验,某厂生产的某产品的抗折能力服从正态分布:根据长期经验,某厂生产的某产品的抗折能力服从正态分布N N(,64 64 kgkg2 2)。现从该厂所生产的一大批产品中随机地抽取)。现从该厂所生产的一大批产品中随机地抽取1010个样品,测得其抗折个样品
19、,测得其抗折能力(单位:能力(单位:kgkg)分别为)分别为578578,572572,570570,568568,570570,572572,570570,572572,596596,584584。请问:这一批产品的平均抗折能力能否被认为是。请问:这一批产品的平均抗折能力能否被认为是570kg570kg(0.050.05)?)?解:根据题意,可建立假设如下:解:根据题意,可建立假设如下:H H0 0:570 kg570 kg H H1 1:570 kg570 kg 查标准正态分布表可知,当显著性水平查标准正态分布表可知,当显著性水平0.050.05时,双侧检验的临界值时,双侧检验的临界值为为
20、1.961.96,则拒绝域为(,则拒绝域为(,1.961.96)(1.961.96,)。)。根据样本数据可知,样本均值根据样本数据可知,样本均值 ,故检验统计量的值,故检验统计量的值 即检验统计量的值落入拒绝域之内,所以要拒绝原假设即检验统计量的值落入拒绝域之内,所以要拒绝原假设H H0 0:570 kg570 kg,接,接受备择假设,也就是说,不能认为这一批产品的平均抗折能力是受备择假设,也就是说,不能认为这一批产品的平均抗折能力是570 kg570 kg。575.2x 96.1056.21085702.575nxZ0原假设:原假设:H H0 0:0 0备择假设:备择假设:H H1 1:0
21、0检验统计量:检验统计量:N(0,1)nxZ0拒绝域:拒绝域:Z ZZ Z 右侧检验右侧检验例例5 5:能否认为这批产品的平均抗折能力超过:能否认为这批产品的平均抗折能力超过570 kg570 kg (0.050.05)?)?解:根据题意可建立假设如下:解:根据题意可建立假设如下:H H0 0:570 kg570 kg H H1 1:570 kg570 kg 显然这是一个右侧检验问题,拒绝域应在抽样分布的右显然这是一个右侧检验问题,拒绝域应在抽样分布的右端。查标准正态分布表可知,在显著性水平端。查标准正态分布表可知,在显著性水平0.050.05下,临下,临界值为界值为Z Z1.651.65,即
22、拒绝域为(,即拒绝域为(1.651.65,)。)。由于检验统计量的值由于检验统计量的值Z Z2.0562.0561.651.65,即落入拒绝域之,即落入拒绝域之内,故要拒绝原假设内,故要拒绝原假设H H0 0:570 kg570 kg,接受备择假设,接受备择假设H H1 1:570 kg570 kg,也就是说,可以认为这一批产品的平均抗折能力,也就是说,可以认为这一批产品的平均抗折能力超过超过570 kg570 kg。原假设:原假设:H H0 0:0 0备择假设:备择假设:H H1 1:0 0检验统计量:检验统计量:N(0,1)nxZ0拒绝域:拒绝域:Z ZZ Z 左侧检验左侧检验 例例6 6
23、:某食品加工企业的质检部门规定,某种食品每包净:某食品加工企业的质检部门规定,某种食品每包净重不得少于重不得少于20 kg20 kg。经验表明,该食品的净重近似服从标准差。经验表明,该食品的净重近似服从标准差为为1.5 kg1.5 kg的正态分布。假定从一个由的正态分布。假定从一个由50 50 包食品构成的随机样包食品构成的随机样本中得到的平均重量为本中得到的平均重量为19.5 kg19.5 kg,问:有无充分证据说明这些,问:有无充分证据说明这些食品的平均重量减少了(食品的平均重量减少了(0.050.05)?)?解:根据题意可建立假设如下:解:根据题意可建立假设如下:H H0 0:20 kg
展开阅读全文