统计学06总体参数的假设检验课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《统计学06总体参数的假设检验课件.ppt》由用户(ziliao2023)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 06 总体 参数 假设检验 课件
- 资源描述:
-
1、统计学从数据到结论第六章 总体参数的假设检验o 如果一个人说他从来没有骂过人。如果一个人说他从来没有骂过人。他能够证明吗?他能够证明吗?o 要证明他没有骂过人,他必须出示要证明他没有骂过人,他必须出示他从小到大每一时刻的录音录像,他从小到大每一时刻的录音录像,所有书写的东西等等,还要证明这所有书写的东西等等,还要证明这些物证是完全的、真实的、没有间些物证是完全的、真实的、没有间断的。这简直是不可能的。断的。这简直是不可能的。o 即使他找到一些证人,比如他的同即使他找到一些证人,比如他的同学、家人和同事,那也只能够证明学、家人和同事,那也只能够证明在那些证人在场的某些片刻,他没在那些证人在场的某
2、些片刻,他没有被听到骂人。有被听到骂人。o反过来,如果要证明这个人反过来,如果要证明这个人骂过人很容易,只要有一次骂过人很容易,只要有一次被抓住就足够了。被抓住就足够了。o看来,企图肯定什么事物很看来,企图肯定什么事物很难,而否定却要相对容易得难,而否定却要相对容易得多。这就是假设检验背后的多。这就是假设检验背后的哲学。哲学。o科学总往往是在否定中发展科学总往往是在否定中发展o在假设检验中,一般要设立在假设检验中,一般要设立一个一个原假设原假设(上面的(上面的“从来从来没骂过人没骂过人”就是一个例子);就是一个例子);o而设立该假设的动机主要是而设立该假设的动机主要是企图利用人们掌握的反映现企
3、图利用人们掌握的反映现实世界的数据来找出假设与实世界的数据来找出假设与现实之间的矛盾,从而否定现实之间的矛盾,从而否定这个假设。这个假设。o在多数统计教科书中在多数统计教科书中(除理论除理论探讨外探讨外)假设检验都是以否定假设检验都是以否定原假设为目标。原假设为目标。o如否定不了,说明证据不足,如否定不了,说明证据不足,无法否定原假设。但不能说无法否定原假设。但不能说明原假设正确。明原假设正确。o就像一两次没有听过他骂人就像一两次没有听过他骂人还远不能证明他从来没有骂还远不能证明他从来没有骂过人。过人。6.1 假设检验的过程和逻辑假设检验的过程和逻辑o 先要提出个原假设,比如某正态总体先要提出
4、个原假设,比如某正态总体的均值等于的均值等于5(m m=5)。这种原假设也称。这种原假设也称为为零假设零假设(null hypothesis),记为,记为H0。o 与此同时必须提出与此同时必须提出备选假设备选假设(或称为或称为备备择假设,择假设,alternative hypothesis),比如,比如总体均值大于总体均值大于5(m m5)。备选假设记)。备选假设记为为H1或或Ha。形式上,这个关于总体均。形式上,这个关于总体均值的值的H0相对于相对于H1的检验记为的检验记为01:5:5HHmm6.1 假设检验的过程和逻辑假设检验的过程和逻辑o 备选假设应该按照实际世界所代表的备选假设应该按照
5、实际世界所代表的方向来确定,即它通常是被认为可能方向来确定,即它通常是被认为可能比零假设更符合数据所代表的现实。比零假设更符合数据所代表的现实。o 比如上面的比如上面的H1为为m m5;这意味着,至少;这意味着,至少样本均值应该大于样本均值应该大于5;o 至于是否显著,依检验结果而定。至于是否显著,依检验结果而定。o 检验结果检验结果显著显著(significant)意味着有理意味着有理由拒绝零假设。因此,假设检验也被由拒绝零假设。因此,假设检验也被称为称为显著性检验显著性检验(significant test)。6.1 假设检验的过程和逻辑假设检验的过程和逻辑o 有了两个假设,就要根据数据来
6、对它有了两个假设,就要根据数据来对它们进行判断。们进行判断。o 数据的代表是作为其函数的统计量;数据的代表是作为其函数的统计量;它在检验中被称为它在检验中被称为检验统计量(检验统计量(test statistic)。o根据零假设根据零假设(不是备选假设!),可(不是备选假设!),可得到该检验统计量的分布;再看这个得到该检验统计量的分布;再看这个统计量的数据实现值(统计量的数据实现值(realization)属)属不属于小概率事件。不属于小概率事件。6.1 假设检验的过程和逻辑假设检验的过程和逻辑o 也就是说把数据代入检验统计量也就是说把数据代入检验统计量,看其值是否落入看其值是否落入零假设下的
7、小概率零假设下的小概率范畴范畴;o 如果的确是小概率事件,那么就有如果的确是小概率事件,那么就有可能拒绝零假设,或者说可能拒绝零假设,或者说“该检验该检验显著,显著,”o 否则说否则说“没有足够证据拒绝零假没有足够证据拒绝零假设设”,或者,或者“该检验不显著。该检验不显著。”6.1 假设检验的过程和逻辑假设检验的过程和逻辑o 注意:注意:在我们所涉及的问题中,零假在我们所涉及的问题中,零假设和备选假设在假设检验中并不对称。设和备选假设在假设检验中并不对称。o 因检验统计量的分布是从零假设导出因检验统计量的分布是从零假设导出的,因此,如果发生矛盾,就对零假的,因此,如果发生矛盾,就对零假设不利了
8、。设不利了。o 不发生矛盾也不能说明零假设没有问不发生矛盾也不能说明零假设没有问题。题。6.1 假设检验的过程和逻辑假设检验的过程和逻辑o 在零假设下,检验统计量取其实现值在零假设下,检验统计量取其实现值及(沿着备选假设的方向)更加极端及(沿着备选假设的方向)更加极端值的概率称为值的概率称为p-值(值(p-value)。o 如果得到很小的如果得到很小的p-值,就意味着在零值,就意味着在零假设下小概率事件发生了。假设下小概率事件发生了。o 如果小概率事件发生,是相信零假设,如果小概率事件发生,是相信零假设,还是相信数据呢?还是相信数据呢?o 当然多半是相信数据,拒绝零假设。当然多半是相信数据,拒
9、绝零假设。6.1 假设检验的过程和逻辑假设检验的过程和逻辑o 但小概率并不能说明不会发生,仅仅但小概率并不能说明不会发生,仅仅发生的概率很小罢了。拒绝正确零假发生的概率很小罢了。拒绝正确零假设的错误常被称为设的错误常被称为第一类错误(第一类错误(type I error)。o 在备选假设正确时反而说零假设正确在备选假设正确时反而说零假设正确的错误,称为的错误,称为第二类错误(第二类错误(type II error)。在本书的假设检验问题中,。在本书的假设检验问题中,由于备选假设不是一个点,所以无法由于备选假设不是一个点,所以无法算出犯第二类错误的概率。算出犯第二类错误的概率。6.1 假设检验的
10、过程和逻辑假设检验的过程和逻辑o 零假设和备选假设哪一个正确,是确零假设和备选假设哪一个正确,是确定性的,没有概率可言。而可能犯错定性的,没有概率可言。而可能犯错误的是人。误的是人。o 涉及假设检验的犯错误的概率就是犯涉及假设检验的犯错误的概率就是犯第一类错误的概率和犯第二类错误的第一类错误的概率和犯第二类错误的概率。概率。o 负责任的态度是无论做出什么决策,负责任的态度是无论做出什么决策,都应该给出该决策可能犯错误的概率。都应该给出该决策可能犯错误的概率。6.1 假设检验的过程和逻辑假设检验的过程和逻辑o 到底到底p-值是多小时才能够拒绝零假设呢?也值是多小时才能够拒绝零假设呢?也就是说,需
11、要有什么是小概率的标准。就是说,需要有什么是小概率的标准。o 这要看具体应用的需要。但在一般的统计书这要看具体应用的需要。但在一般的统计书和软件中,使用最多的标准是在零假设下和软件中,使用最多的标准是在零假设下(或零假设正确时)根据样本所得的数据来(或零假设正确时)根据样本所得的数据来拒绝零假设的概率应小于拒绝零假设的概率应小于0.05,当然也可能,当然也可能是是0.01,0.005,0.001等等。等等。o 这 种 事 先 规 定 的 概 率 称 为这 种 事 先 规 定 的 概 率 称 为 显 著 性 水 平显 著 性 水 平(significant level),用字母,用字母a a来表
12、示。来表示。6.1 假设检验的过程和逻辑假设检验的过程和逻辑o a a并不一定越小越好,因为这很可能导致不并不一定越小越好,因为这很可能导致不容易拒绝零假设,使得犯第二类错误的概率容易拒绝零假设,使得犯第二类错误的概率增大。增大。o 当当p-值小于或等于值小于或等于a a时,就拒绝零假设。所时,就拒绝零假设。所以,以,a a是所允许的犯第一类错误概率的最大是所允许的犯第一类错误概率的最大值。当值。当p-值小于或等于值小于或等于a a时,就说这个检验时,就说这个检验是显著的。是显著的。o 无论统计学家用多大的无论统计学家用多大的a a作为显著性水平都作为显著性水平都不能脱离实际问题的背景。统计显
13、著不一定不能脱离实际问题的背景。统计显著不一定等价于实际显著。反过来也一样。等价于实际显著。反过来也一样。6.1 假设检验的过程和逻辑假设检验的过程和逻辑o 归纳起来,假设检验的逻辑步骤为:归纳起来,假设检验的逻辑步骤为:o 1.写出零假设和备选假设;写出零假设和备选假设;o 2.确定检验统计量;确定检验统计量;o 3.确定显著性水平确定显著性水平a a;o 4.根据数据计算检验统计量的实现值;根据数据计算检验统计量的实现值;o 5.根据这个实现值计算根据这个实现值计算p-值;值;o 6.进行判断:如果进行判断:如果p-值小于或等于值小于或等于a a,就拒,就拒绝零假设,这时犯(第一类)错误的
14、概率最绝零假设,这时犯(第一类)错误的概率最多为多为a a;如果;如果p-值大于值大于a a,就不拒绝零假设,就不拒绝零假设,因为证据不足。因为证据不足。6.1 假设检验的过程和逻辑假设检验的过程和逻辑o 实际上,多数计算机软件仅仅给出实际上,多数计算机软件仅仅给出p-值,而值,而不给出不给出a a。这有很多方便之处。这有很多方便之处。o 比如比如a a=0.05,而假定所得到的,而假定所得到的p-值等于值等于0.001。这时如果采用这时如果采用p-值作为新的显著性水平,即值作为新的显著性水平,即新的新的a a=0.001,于是就可以说,在显著性水,于是就可以说,在显著性水平为平为0.001时
15、,拒绝零假设。时,拒绝零假设。o 这样,拒绝零假设时犯错误的概率实际只是这样,拒绝零假设时犯错误的概率实际只是千分之一而不是旧的千分之一而不是旧的a a所表明的百分之五。所表明的百分之五。在这个意义上,在这个意义上,p-值又称为值又称为观测的显著性水观测的显著性水平(平(observed significant level)。6.1 假设检验的过程和逻辑假设检验的过程和逻辑o 在统计软件输出在统计软件输出p-值的位置,有的用值的位置,有的用“p-value”,有的用,有的用significant的缩写的缩写“Sig”就是就是这个道理。这个道理。o 根据数据产生的根据数据产生的p-值来减少值来减
16、少a a的值以展示结的值以展示结果的精确性总是没有害处的。果的精确性总是没有害处的。o 这好比一个身高这好比一个身高180厘米的男生,可能愿意厘米的男生,可能愿意被认为高于或等于被认为高于或等于180厘米,而不愿意说他厘米,而不愿意说他高于或等于高于或等于155厘米,虽然这第二种说法数厘米,虽然这第二种说法数学上没有丝毫错误。学上没有丝毫错误。6.1 假设检验的过程和逻辑假设检验的过程和逻辑o 关于关于“临界值临界值”的注:的注:作为概率的显著性水平a实际上相应于一个检验统计量取值范围的一个临界值(临界值(critical value),它定义为,统计量取该值或更极端的值的概率等于a。也就是说
17、,“统计量的实现值比临界值更极端统计量的实现值比临界值更极端”等价于等价于“p-值小于值小于a a”。使用临界值的概念进行的检验不计算p-值。只比较统计量的取值和临界值的大小。6.1 假设检验的过程和逻辑假设检验的过程和逻辑o 使用临界值而不是使用临界值而不是p-值来判断拒绝与否是值来判断拒绝与否是前前计算机时代的产物计算机时代的产物。当时计算。当时计算p-值不易,只值不易,只采用临界值的概念。但从给定的采用临界值的概念。但从给定的a a求临界值求临界值同样也不容易,好在习惯上仅仅在教科书中同样也不容易,好在习惯上仅仅在教科书中列出相应于特定分布的几个有限的列出相应于特定分布的几个有限的a a
18、临界值临界值(比如(比如a a=0.05,a a=0.025,a a=0.01,a a=0.005,a a=0.001等等),或者根据分布表反过来查等等),或者根据分布表反过来查临界值(很不方便也很粗糙)。临界值(很不方便也很粗糙)。o 现在计算机软件大都不给出现在计算机软件大都不给出a a和临界值,但和临界值,但都给出都给出p-值和统计量的实现值,让用户自己值和统计量的实现值,让用户自己决定显著性水平是多少。决定显著性水平是多少。6.1 假设检验的过程和逻辑假设检验的过程和逻辑o 在一些统计教科书中会有不能拒绝零假设就在一些统计教科书中会有不能拒绝零假设就“接受零假设接受零假设”的说法。这种
19、说法是不严格的说法。这种说法是不严格的。的。o 首先,如果你说首先,如果你说“接受零假设接受零假设”,那么就应,那么就应该负责任地提供接受零假设时可能犯第二类该负责任地提供接受零假设时可能犯第二类错误的概率。这就要算出在备选假设正确的错误的概率。这就要算出在备选假设正确的情况下错误接受零假设的概率。但是,这只情况下错误接受零假设的概率。但是,这只有在备选假设仅仅是一个与零假设不同的确有在备选假设仅仅是一个与零假设不同的确定值(而不是范围)时才有可能。定值(而不是范围)时才有可能。o 多数基本统计教科书的备选假设是一个范围多数基本统计教科书的备选假设是一个范围而根本无法确定犯第二类错误的概率。而
20、根本无法确定犯第二类错误的概率。6.1 假设检验的过程和逻辑假设检验的过程和逻辑o 在许多统计教科书中,往往把一系列在许多统计教科书中,往往把一系列不能拒绝零假设的检验当成接受这些不能拒绝零假设的检验当成接受这些假设的通行证。假设的通行证。o 比如不能拒绝某样本的正态性就变成比如不能拒绝某样本的正态性就变成了证明了该样本是正态的等等。了证明了该样本是正态的等等。o 不能拒绝这些零假设,仅仅说明根据不能拒绝这些零假设,仅仅说明根据所使用的检验方法(或检验统计量)所使用的检验方法(或检验统计量)和当前的数据没有足够证据拒绝这些和当前的数据没有足够证据拒绝这些假设而已。假设而已。6.1 假设检验的过
21、程和逻辑假设检验的过程和逻辑o 对于同一个假设检验问题,往往都有对于同一个假设检验问题,往往都有多个检验统计量;而且人们还在构造多个检验统计量;而且人们还在构造更优良的检验统计量。更优良的检验统计量。o 人们不可能把所有的目前存在的和将人们不可能把所有的目前存在的和将来可能存在的检验都实施。来可能存在的检验都实施。o 因此,只能够说,按照目前的证据,因此,只能够说,按照目前的证据,不足以拒绝零假设而已。后面将会用不足以拒绝零假设而已。后面将会用例子说明例子说明“接受零假设接受零假设”的说法是不的说法是不妥当的。妥当的。6.2 对于正态总体均值的检验对于正态总体均值的检验6.2.1 根据一个样本
22、对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验o 例例6.1一个顾客买了一包标有一个顾客买了一包标有500g重的一包红重的一包红糖,觉得份量不足,于是找到监督部门;当糖,觉得份量不足,于是找到监督部门;当然他们会觉得一包份量不够可能是随机的。然他们会觉得一包份量不够可能是随机的。于是监督部门就去商店称了于是监督部门就去商店称了50包红糖(数据包红糖(数据在在sugar.txt);其中均值(平均重量)是);其中均值(平均重量)是498.35g;这的确比;这的确比500g少,但这是否能够说少,但这是否能够说明厂家生产的这批红糖平均起来不够份量呢?明厂家生产的这批红糖平均起来不够份量呢
23、?于是需要统计检验。可以画出这些重量的直于是需要统计检验。可以画出这些重量的直方图方图50包红糖重量的直方图包红糖重量的直方图 Histogram of Sugar WeightweightFrequency49049550050502468106.2.1 根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验o 这个直方图看上去象是正态分布的样本。不这个直方图看上去象是正态分布的样本。不妨假定这一批袋装红糖有正态分布。妨假定这一批袋装红糖有正态分布。o 由于厂家声称每袋由于厂家声称每袋500g(标明重量),因此(标明重量),因此零假设为总体均值等于零假设为总体均值等于500
24、g(被怀疑对象总(被怀疑对象总是放在零假设);是放在零假设);o 而且由于样本均值少于而且由于样本均值少于500g(这是怀疑的根这是怀疑的根据据),把备选假设定为总体均值少于,把备选假设定为总体均值少于500g(备选假设为单向不等式的检验称为单尾检(备选假设为单向不等式的检验称为单尾检验验,为不等号为不等号“”的称为双尾检验的称为双尾检验)01:500:500HHmm6.2.1 根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验o 检验统计量就是第四章引进的作为对检验统计量就是第四章引进的作为对均值的某种标准化的均值的某种标准化的o 符号中的符号中的m m0通常表示为零假
25、设中的均通常表示为零假设中的均值(这里是值(这里是500)。在零假设之下,它)。在零假设之下,它有自由度为有自由度为n-1=49的的t分布。当然实际分布。当然实际上不必代入这个公式去手工计算了,上不必代入这个公式去手工计算了,让计算机去代劳好了。让计算机去代劳好了。0/xtsnm6.2.1 根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验o 计算结果是计算结果是t=-2.696(也称为(也称为t值)值),同时得到同时得到p-值为值为0.005(由于计算机输出的为双尾检验(由于计算机输出的为双尾检验的的p-值,比单尾的大一倍,应该除以值,比单尾的大一倍,应该除以2)。)。
展开阅读全文