第五统计假设测验精选课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第五统计假设测验精选课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第五 统计 假设 测验 精选 课件
- 资源描述:
-
1、第五章统计假设测验第五章统计假设测验第一节第一节 统计假设测验的基本原理统计假设测验的基本原理第二节第二节 平均数的假设测验平均数的假设测验第三节第三节 二项资料的百分数假设测验二项资料的百分数假设测验第四节第四节 参数的区间估计参数的区间估计第一节统计假设测验的基本原理第一节统计假设测验的基本原理一、统计假设的基本概念一、统计假设的基本概念二、统计假设测验的基本方法二、统计假设测验的基本方法三、两尾测验与一尾测验。三、两尾测验与一尾测验。四、假设测验的两类错误四、假设测验的两类错误一、统计假设的基本概念一、统计假设的基本概念 所谓所谓统计假设统计假设(statistical hypothes
2、is)(statistical hypothesis)是指有关某一总体是指有关某一总体参数的假设。例如假设某小麦新品种的产量和原地方品种参数的假设。例如假设某小麦新品种的产量和原地方品种的产量一样,或者比旧地方品种更好。的产量一样,或者比旧地方品种更好。单个平均数的假设单个平均数的假设适于统计测验的假设适于统计测验的假设 两个平均数相比较的假设两个平均数相比较的假设 (一一)单个平均数的假设单个平均数的假设 一个样本是从一个具有平均数一个样本是从一个具有平均数 的总体中随机抽的总体中随机抽出的,记作:出的,记作:。例如:。例如:(1)某一小麦品种的产量具有原地方品种的产量,某一小麦品种的产量具
3、有原地方品种的产量,这指新品种的产量表现乃原地方品种产量表现的一个随这指新品种的产量表现乃原地方品种产量表现的一个随机样本,其平均产量机样本,其平均产量 等于某一指定值等于某一指定值 ,故记,故记为为 。(2)某一棉花品种的纤维长度某一棉花品种的纤维长度()具有工业上某一具有工业上某一指定的标准指定的标准(),这可记为,这可记为 。000:H00:H0CH:0C(二二)两个平均数相比较的假设两个平均数相比较的假设 两个样本乃从两个具有相等参数的总体中随机抽出两个样本乃从两个具有相等参数的总体中随机抽出的,记为的,记为 或或 。例如:。例如:(1)两个小麦品种的产量是相同的。两个小麦品种的产量是
4、相同的。(2)两种杀虫药剂对于某种害虫的药效是相等的。两种杀虫药剂对于某种害虫的药效是相等的。210:H 上述两种假设称为上述两种假设称为无效假设无效假设(null hypothesis)(null hypothesis)。因为假设。因为假设总体参数总体参数(平均数平均数)与某一指定值相等或假设两个总体参数相与某一指定值相等或假设两个总体参数相等,即假设其没有效应差异,或者说实得差异是由误差造等,即假设其没有效应差异,或者说实得差异是由误差造成的。成的。0:210H 和无效假设相对应的应有一个统计假设,叫和无效假设相对应的应有一个统计假设,叫对应对应假设假设或或备择假设备择假设(alterna
5、tive hypothesis)(alternative hypothesis),记作,记作 或或 。如果否定了无效假设,则必接受备择假设;同理,如果否定了无效假设,则必接受备择假设;同理,如果接受了无效假设,当然也就否定了备择假设。如果接受了无效假设,当然也就否定了备择假设。0:AH21:AH二、统计假设测验的基本方法二、统计假设测验的基本方法 (一一)对所研究的总体首先提出一个统计假设对所研究的总体首先提出一个统计假设 (二二)在承认上述无效假设的前提下,获得平均数在承认上述无效假设的前提下,获得平均数的抽样分布,计算该假设正确的概率的抽样分布,计算该假设正确的概率 (三三)根据根据“小概
6、率事件实际上不可能发生小概率事件实际上不可能发生”原理原理接受或否定假设接受或否定假设 下面以一个例子说明假设测验方法的具体内容。下面以一个例子说明假设测验方法的具体内容。设某地区的当地小麦品种一般设某地区的当地小麦品种一般667m2产产300kg,即,即当地品种这个总体的平均数当地品种这个总体的平均数 =300(kg),并从多年种植,并从多年种植结果获得其标准差结果获得其标准差=75(kg),而现有某新品种通过,而现有某新品种通过25个个小区的试验,计得其样本平均产量为每小区的试验,计得其样本平均产量为每667m2330kg,即即 =330,那么新品种样本所属总体与,那么新品种样本所属总体与
7、 =300的当地品的当地品种这个总体是否有显著差异呢?以下将说明对此假设进种这个总体是否有显著差异呢?以下将说明对此假设进行统计测验的方法。行统计测验的方法。0y0 (一一)对所研究的总体首先提出一个无效假设对所研究的总体首先提出一个无效假设 通常所做的无效假设常为所比较的两个总体间无差异。通常所做的无效假设常为所比较的两个总体间无差异。测验单个平均数,则假设该样本是从一已知总体测验单个平均数,则假设该样本是从一已知总体(总体平均总体平均数为指定值数为指定值 )中随机抽出的,即中随机抽出的,即 。如上例,即。如上例,即假定新品种的总体平均数假定新品种的总体平均数 等于原品种的总体平均数等于原品
8、种的总体平均数=300kg,而样本平均数和之间的差数:,而样本平均数和之间的差数:330300=30(kg)属属随机误差;对应假设则为随机误差;对应假设则为 。如果测验两个平均数,则假设两个样本的总体平均数相等,如果测验两个平均数,则假设两个样本的总体平均数相等,即即 ,也就是假设两个样本平均数的差数,也就是假设两个样本平均数的差数 属随机误差,而非真实差异;其对应假设则为属随机误差,而非真实差异;其对应假设则为 。000:H00:AH210:H21yy 21:AH (二二)在承认上述无效假设的前提下,获得平均数的在承认上述无效假设的前提下,获得平均数的抽样分布,计算假设正确的概率抽样分布,计
9、算假设正确的概率 先承认无效假设,从已知总体中抽取样本容量为先承认无效假设,从已知总体中抽取样本容量为n=25的样本,该样本平均数的抽样分布具正态分布形状,的样本,该样本平均数的抽样分布具正态分布形状,平均数平均数 =300(kg),标准误,标准误 =15(kg)。通过试验,如果新品种的平均产量很接近。通过试验,如果新品种的平均产量很接近300 kg,例如,例如301kg或或299kg等,则试验结果当然与假设相符,等,则试验结果当然与假设相符,于是应接受于是应接受H0。如果新品种的平均产量为。如果新品种的平均产量为500kg,与总,与总体假设相差很大,那当然应否定体假设相差很大,那当然应否定H
10、0。但如果试验结果与。但如果试验结果与总体假设并不相差悬殊总体假设并不相差悬殊,就要借助于概率原理,具体做就要借助于概率原理,具体做法有以下两种:法有以下两种:y2575ny1.计算概率计算概率 在假设在假设 为正确的条件下,根据的抽样分布算出为正确的条件下,根据的抽样分布算出获得获得 =330kg的概率,或者说算得出现随机误差的概率,或者说算得出现随机误差 =30(kg)的概率:在此,根据的概率:在此,根据u 测验公式可算得:测验公式可算得:0Hy0y 因为假设是新品种产量有大于或小于当地品种产量的可能因为假设是新品种产量有大于或小于当地品种产量的可能性,所以需用两尾测验。性,所以需用两尾测
11、验。查附表查附表3,当,当u=2时,时,P(概率概率)界于界于0.04和和0.05之间,即这之间,即这一试验结果:一试验结果:=30(kg),属于抽样误差的概率小于,属于抽样误差的概率小于5%。0y215300330yyu2.计算接受区和否定区计算接受区和否定区 在假设在假设H0为正确的条件下,根据为正确的条件下,根据 的的抽样分布划出一个区间,如抽样分布划出一个区间,如 在这一区间内则接受在这一区间内则接受H0,如,如 在在这一区间外则否定这一区间外则否定H0。如何确定这一区间呢?如何确定这一区间呢?yyyyyyu根据上章所述根据上章所述 和和 的分布,可知:的分布,可知:95.096.19
12、6.1yyyP025.096.1yyP025.096.1yyP025.0)96.1(yyP025.0)96.1(yyP 因此,在因此,在 的抽样分布中,落在的抽样分布中,落在()区间内的有区间内的有95%,落在这一区间外的只有,落在这一区间外的只有5%。yyy96.196.1,如果以如果以5%概率作为接受或否定概率作为接受或否定H0的界限,则上述区间的界限,则上述区间()为接受假设的区域,简称为接受假设的区域,简称接受区接受区(acceptance region)(acceptance region);和和 为否定为否定假设的区域,简称假设的区域,简称否定区否定区(rejection regi
13、on)(rejection region)。yy96.196.1,yy96.1yy96.1 同理,若以同理,若以1%作为接受或否定作为接受或否定H0的界限,则的界限,则()为接受区域,为接受区域,和和 为否定区域。为否定区域。yy58.258.2,yy58.2yy58.2 所以在测验时需先计算所以在测验时需先计算1.96 或或2.58 ,然后从,然后从 加加上和减去上和减去1.96 或或2.58 ,即得两个否定区域的临界值。,即得两个否定区域的临界值。yyyyy2552702853003153303450.000.010.020.03fN(y)y329.4270.6否定区 域 2.5%否定区
14、域 2.5%接 受 区 域 如上述小麦新品种例,如上述小麦新品种例,=300,,1.96 =29.4(kg)。因之,。因之,它的两个它的两个2.5%概率概率的否定区域为的否定区域为 30029.4和和 300+29.4,即,即大于大于329.4(kg)和小于和小于270.6(kg)的概率只有的概率只有5%(见图见图5.1)。0y15yyy图图5.1 5%显著水平假设测验图示显著水平假设测验图示(表示接受区域和否定区域)(表示接受区域和否定区域)(三三)根据根据“小概率事件实际上不可能发生小概率事件实际上不可能发生”原理接受或否定假设原理接受或否定假设 当当 由随机误差造成的概率小于由随机误差造
15、成的概率小于5%或或1%时,就可时,就可认为它不可能属于抽样误差,从而否定假设。认为它不可能属于抽样误差,从而否定假设。如果因随机误差而得到某差数的概率如果因随机误差而得到某差数的概率P0.05,则称这个,则称这个差数是显著的。如果因随机误差而得到某差数的概率差数是显著的。如果因随机误差而得到某差数的概率P0.01,则称这个差数是极显著的。而这种假设测验也叫显著性测验。则称这个差数是极显著的。而这种假设测验也叫显著性测验。用来测验假设的概率标准用来测验假设的概率标准5%或或1%等,称为等,称为显著水平显著水平(significance level)(significance level)。一般
16、以一般以 表示,如表示,如 =0.05或或 =0.01。y综合上述,统计假设测验的步骤可总结如下:综合上述,统计假设测验的步骤可总结如下:(1)对样本所属的总体提出统计假设,包括无效假设和备对样本所属的总体提出统计假设,包括无效假设和备择假设。择假设。(2)规定测验的显著水平规定测验的显著水平 值。值。(3)在在 为正确的假定下,根据平均数为正确的假定下,根据平均数()或其他统计数或其他统计数的抽样分布,如为正态分布的则计算正态离差的抽样分布,如为正态分布的则计算正态离差u值。由值。由u值查值查附表附表3即可知道因随机抽样而获得实际差数即可知道因随机抽样而获得实际差数(如如 等等)由误差由误差
17、造成的概率。或者根据已规定概率,如造成的概率。或者根据已规定概率,如 =0.05,查出查出u=1.96,因而划出两个否定区域为因而划出两个否定区域为:和和 (4)将规定的将规定的 值和算得的值和算得的u值的概率相比较,或者将试值的概率相比较,或者将试验结果和否定区域相比较,从而作出接受或否定无效假设的验结果和否定区域相比较,从而作出接受或否定无效假设的推断。推断。0Hyyyy96.1yy96.1三、两尾测验与一尾测验三、两尾测验与一尾测验 如果统计假设为如果统计假设为 ,则备择假设为则备择假设为 ,在在假设测验时所考虑的概率为曲线左边一尾概率假设测验时所考虑的概率为曲线左边一尾概率(小于小于
18、)和右和右边一尾概率边一尾概率(大于大于 )的总和。这类测验称为的总和。这类测验称为两尾测验两尾测验(two-(two-tailed test)tailed test),它具有两个否定区域。,它具有两个否定区域。00:H0:AH00 如果统计假设为如果统计假设为 ,则其对应的备择假设必则其对应的备择假设必为为 。因而,这个对应的备择假设仅有一种可能性。因而,这个对应的备择假设仅有一种可能性,而统计假设仅有一个否定区域,即曲线的右边一尾。这类测而统计假设仅有一个否定区域,即曲线的右边一尾。这类测验称验称一尾测验一尾测验(one-tailed test)(one-tailed test)。一尾测验
19、还有另一种情况,。一尾测验还有另一种情况,即即 ,,这时否定区域在左边一尾这时否定区域在左边一尾.作一尾测验时,需将附表作一尾测验时,需将附表3列出的两尾概率乘以列出的两尾概率乘以1/2,再,再查出其查出其u值。值。00:H0:AH00:H0:AH四、假设测验的两类错误四、假设测验的两类错误表5.1 假设测验的两类错误测验结测验结果果如果如果H0是是正确的正确的如果如果H0是是错误的错误的H0被否被否定定 第一类错第一类错误误 没有错没有错误误H0被接被接受受 没有错误没有错误 第二类第二类错误错误 第一类错误的概率为显著水平第一类错误的概率为显著水平 值。值。第二类错误的概率为第二类错误的概
20、率为 值。值。值的计算方法就是计算值的计算方法就是计算抽样平均数落在已知总体的接受区的概率抽样平均数落在已知总体的接受区的概率(这里的已知总体这里的已知总体是假定的是假定的)。例:已知总体的均值例:已知总体的均值 =300,其平均数抽样标准误为,其平均数抽样标准误为15,被抽样总体的平均数被抽样总体的平均数 315kg、标准误也为、标准误也为15,由此可以画,由此可以画出这两个总体的分布曲线如图出这两个总体的分布曲线如图5.2,图中标出了已知总体的接,图中标出了已知总体的接受区域在受区域在c1和和c2之间。由于两个总体的平均数不同,这种可能之间。由于两个总体的平均数不同,这种可能性正是第二类错
21、误的概率值,其一般计算方法为:性正是第二类错误的概率值,其一般计算方法为:09621531562701.u9601531543292.u查附表查附表2,P(u12.96)=0.0015,P(u20.96)=0.8315,故有故有 =P(u20.96)P(u1 2.96)=0.83150.0015=0.83或或83%25527028530031533034536083%c2c1图图5.2 :=300是错误时的是错误时的 值值0 0H关于两类错误的讨论可总结如下:关于两类错误的讨论可总结如下:(1)在样本容量在样本容量n固定的条件下,提高显著水平固定的条件下,提高显著水平 (取较小的取较小的值值)
22、,如从,如从5%变为变为1%则将增大第二类错误的概率则将增大第二类错误的概率 值。值。(2)在在n和显著水平和显著水平 相同的条件下,真总体平均数相同的条件下,真总体平均数 和假设和假设平均数平均数 的相差的相差(以标准误为单位以标准误为单位)愈大,则犯第二类错误的概愈大,则犯第二类错误的概率率 值愈小。值愈小。(3)为了降低犯两类错误的概率,需采用一个较低的显著水为了降低犯两类错误的概率,需采用一个较低的显著水平,如平,如 =0.05;同时适当增加样本容量,或适当减小总体方;同时适当增加样本容量,或适当减小总体方差差 ,或两者兼有之。,或两者兼有之。(4)如果显著水平如果显著水平 已固定下来
23、,则改进试验技术和增加样已固定下来,则改进试验技术和增加样本容量可以有效地降低犯第二类错误的概率。本容量可以有效地降低犯第二类错误的概率。02第二节第二节 平均数的假设测验平均数的假设测验一、一、t 分布分布二、单个样本平均数的假设测验二、单个样本平均数的假设测验三、两个样本平均数相比较的假设测验三、两个样本平均数相比较的假设测验一、一、t 分布分布 从一个平均数为从一个平均数为 、方差为、方差为 的正态总体中抽样,的正态总体中抽样,2y),(2yNyyu (2)当样本容量不太大当样本容量不太大(n30)而而 为未知时,以样本均为未知时,以样本均方方 估计估计 ,则其标准化离差,则其标准化离差
24、 的分布不呈正态,的分布不呈正态,而作而作 t 分布,具有自由度分布,具有自由度DF=n-1。(1)样本平均数样本平均数 的分布必趋向正态分布的分布必趋向正态分布 ,并且并且 遵循正态分布遵循正态分布N(0,1)。22s2ysy)(ysyt(51)nssy 为样本平均数的标准误,为样本平均数的标准误,s为样本标准差,为样本标准差,n为样本容量。为样本容量。t 分布分布(t-distribution)是是1908年年.S.Gosset首先提出的,又首先提出的,又叫学生氏分布叫学生氏分布(students t distribution)。它是一组对称密度函数。它是一组对称密度函数曲线,具有一个单独
25、参数曲线,具有一个单独参数 以确定某一特定分布。以确定某一特定分布。v 是自由度。是自由度。在理论上,当在理论上,当v 增大时,增大时,t 分布趋向于正态分布。分布趋向于正态分布。t 分布的密度函数为:分布的密度函数为:t 分布的平均数和标准差为:分布的平均数和标准差为:(54)2210)()(假定假定假定假定tt)()1(2)2(2)1()()21(2t t!/!/tf(53)-4-20240.000.050.100.150.200.250.300.350.400.45t分布(df=4)正 态分布图图5.5 标准化正态分布与自由度标准化正态分布与自由度为为4 4的的t t分布曲线分布曲线 t
展开阅读全文