抽样及抽样分布课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《抽样及抽样分布课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样 分布 课件
- 资源描述:
-
1、假设检验问题假设检验问题如果一个人说他是素食者。如何证明?如果一个人说他是素食者。如何证明?很难!很难!反反之之,如果要证明这个人吃过肉很容易,只要有一,如果要证明这个人吃过肉很容易,只要有一次就足够了。次就足够了。肯定什么事物很难,而否定却要相对容易得多。这肯定什么事物很难,而否定却要相对容易得多。这就是假设检验背后的哲学。就是假设检验背后的哲学。在假设检验中,要设立一个在假设检验中,要设立一个原假设原假设(“从未吃过肉从未吃过肉”就就是一个例子);是一个例子);而设立该假设的动机主要是利用人们掌握的反映现而设立该假设的动机主要是利用人们掌握的反映现实世界的数据来找出假设与现实之间的矛盾,从
2、而实世界的数据来找出假设与现实之间的矛盾,从而否定否定这个假设。这个假设。假设检验的思想假设检验的思想从一个例子看假设检验的思想 例例:100个银行职员样本的月收入个银行职员样本的月收入8300元,元,你是否能接受你是否能接受“全体银行职员的平均月收入全体银行职员的平均月收入为为 8250元元?12000元元?8000元元”?很难说,因为如果很难说,因为如果“=8000元元”这个说法(假设)成这个说法(假设)成立,样本均值立,样本均值8300离离=8000不太近也不太远不太近也不太远,出现的可出现的可能性不好判断。能性不好判断。假设检验遵从假设检验遵从“小概率事件一次实验发生小概率事件一次实验
3、发生概率极小概率极小”原则。原则。带有概率性质的反证法带有概率性质的反证法 统计推断统计推断参数估计假设检验通过样本统计量推断总体参数的置信区间利用样本信息判断对总体参数的假设值是否成立第六章 假设检验(参数检验)hypothesis testing 检验思想的逻辑:(20世纪30年代费歇尔提出)利用样本信息判断对总体参数的假设值是否成立 本章主要内容 假设的基本概念 显著性水平 假设检验的种类 假设检验中的两类错误 假设检验的规则 假设检验的步骤 单一总体的均值或比率的假设检验 两个总体均值或比率差异的假设检验 消协接到消费者投诉,指控某品牌饮料容量不足,包装上标明的容量为500毫升。消协随
4、机抽取50代该种饮料,测得平均重量为498.35毫升,标准差4.33毫升。消协能否根据样本数据,判定是生产中的正常波动,还是厂家有意所为?生产线加工的产品废品率长期不超过1%,某日抽取100件,两件是废品,生产线是否正常?。?差异产生的原因:原因一:样本来自总体,样本差异源于由抽样的随机性 原因二:样本不属于已知总体,差异源于总体本身假设检验的步骤 根据实际问题提出假设根据实际问题提出假设 给定显著性水平给定显著性水平 确定原假设成立条件下统计量的抽样分布确定原假设成立条件下统计量的抽样分布 计算检验的统计量计算检验的统计量 根据检验统计量的结果根据检验统计量的结果,按照检验规则作出决策按照检
5、验规则作出决策第一节 假设检验的概念 一 假设检验的有关概念 假设假设:关于总体参数值的一种看法或陈述关于总体参数值的一种看法或陈述 零假设(零假设(Null hypothesisNull hypothesis)接受检验的基本假设,)接受检验的基本假设,带等号:带等号:no change no differenceno change no difference 据样本数据结果欲推翻的假设据样本数据结果欲推翻的假设 备择假设(备择假设(AlternatihypothesisAlternatihypothesis)零假设的对立假设,)零假设的对立假设,不带等号:不带等号:250:250=:=:10
6、0100HHHH、据样本数据结果欲支持的假设据样本数据结果欲支持的假设二 假设检验的种类 双尾检验:拒绝域在两侧 单尾检验:拒绝域在一側 左单尾检验:拒绝域在左側 右单尾检验:拒绝域在右側0100:HH0100:HH0100:HH0100:HH0100:HH0100:HH怎样建立零假设和备择假设 对某种标准是否符合进行检验对某种标准是否符合进行检验:将标准作为原假设将标准作为原假设.例:某机床配件的规格为1.5毫米,委托外企业加工,对加工后的配件进行检验,检验研究结果检验研究结果:研究者对研究结果的假设设为备择假,研究者对研究结果的假设设为备择假,备择假设应该按照实际世界所代表的方向来确定备择
7、假设应该按照实际世界所代表的方向来确定 某医药研究机构发明一种治疗感冒的新药,以往感冒药效持续时间最长可达24小时,对新药持续时间检验 对某种观点有效性的检验对某种观点有效性的检验:(相信与否)相信与否)某电脑显示器制造商申称,其寿命不低于10000小时 10000:10000:10HH24:24:10HH5.1:1.5=:10HH10000:10000:10HH关于设立假设的讨论 购货方与销货方双方协定,产品的次品率高于3%,则购货方可以退货,如果你是购货方,对产品质量进行检验:如果销货方一贯信誉很好,如何假设?如前例:如果销货方信誉不太好,如何假设?如前例 左右都可以设,看先验信息、依据背
8、景考虑:严格:反方向设;宽松:顺方向设 零假设是研究者想用证据推翻的内容零假设是研究者想用证据推翻的内容 备择假设是研究者想用证据支持的内容备择假设是研究者想用证据支持的内容 一对假设的设立会体现研究者的主观意愿一对假设的设立会体现研究者的主观意愿 例 某公司设计了一种充气包,这种充气包在发生交通事故时能对司机起到缓冲保护作用。该公司广告称该充气包在发生交通事故时不超过0.2秒钟即可将气包充好,现随机抽取100个样本,测得其平均充气时间为0.19秒,标准差为0.01秒,对该公司广告的真实性作出决策。05.02.0:2.0:10HHtailedright2.0:2.0:10HHtailedlef
9、t表述方法1表述方法2假设H0:0.2秒H0:0.2秒H1:0.2秒H1:0.2秒生产的充气包的平均充气时间不超过0.2秒,但却拒绝了H0认为不合格。这使厂商失去业务机会。充气包的平均充气时间超过0.2秒,但却拒绝了H0,认为合格,这势必导致人身伤亡,并导致商誉严重损失。型错误平均充气时间超过0.2秒,但却认为其低于0.2秒,而接受H0。这势必导致人身伤亡,并导致商誉严重损失。平均充气时间不超过0.2秒,但却接受了H0,认为超过了0.2秒,不合格。这使厂商失去业务机会。型错误态度努力防止将合格产品误判为不合格的风险,重在保护厂商利益。努力防止将不合格产品误判合格的风险,重在保护消费者利益。三、
10、显著性水平 小概率事件发生的概率。(小概率事件在一次实验中发生的概率很小).原假设是正确而根据样本的信息却拒绝了原假设的概率,也叫拒绝域。根据实际问题事先确定,一般取 0.01,0.05,0.10。检验结果显著(significant)意味着有理由拒绝零假设。因此,假设检验也被称为显著性检验(significant test)。表明样本统计量和总体参数的差异显著设的概率是接受一个正确的零假1 拒绝/接受域的图示025.0205.021拒绝域 拒绝域x250,=:0H接受域10.090.0190.0110.0显著性水平越小,越不容易拒绝原假设,显著性水平越大,越容易拒绝原假设,很小/大的显著性水
11、平说明什么95.01025.0205.021 拒绝域 拒绝域 四、两类错误两类错误 第一型错误(弃真错误)原假设为真,样本信息提供拒绝原假设的统计证据。拒绝一个正确的原假设.犯这个错误的概率为 即显著性水平.统计中将只控制I型错误,不考虑错误的检验称显著性检验 第二型错误(取伪错误)备择假设为真,样本信息提供不能拒绝原假设的统计证据。接受了一个错误的原假设,犯这个错误的概率为的概率拒绝一个错误的原假设:1零假设备择假设哪个正确?有可能犯错误的是?一个小概率事件出现,因此拒绝原假设。a值越大,表明犯弃真错误的概率越大,越容易拒绝原假设,此时称检验越严格。如果在型错误的概率为5或1下拒绝原假设,说
12、明100次拒绝原假设结论中,平均有5次或1次是错误的。a值需要由检验目的来确定,当取伪造成的损失大于弃真造成的损失时,应扩大a值。显著性水平的给定对检验结果有一定影响,在一个水平下是显著成立的,在另一个水平下可能不成立。这正是统计学意义上的结论的严格性与科学性所在。的关系和 反方向变动 同时减少犯两种错误的概率 奈曼和皮尔逊提出:在控制 I 型错误的概率的条件下,尽量使 II 型错误的概率减少。01两类两类错误的关系错误的关系好的检验法则:如果减小拒绝域,就意味着扩大接受域,从而扩大了犯取伪错误的概率。弃真和取伪是一对矛盾1)扩大样本量,2)使用更好的统计量,才可以使二者同时缩小 nsxz/检
13、验统计量是数据的代表 根据原假设可知检验统计量的分布 检验统计量的实现值是否小概率事件 小概率事件发生了,称检验结果显著 原假设和备择假设并不对称 假设检验与区间估计的关系 (在 接受原假设,则 必覆盖总体参数)nxz/nsxt/检验统计量1 五、假设检验的决策结果:原假设真实,样本数据支持接受原假设 原假设不真实,样本数据不支持接受原假设 原假设真实,样本数据不支持接受原假设 原假设不真实,样本数据支持接受原假设 为真 不真实 接受 拒绝 判断正确 弃真 错误取伪错误 判断正确0H0H0H0H 传统假设检验的步骤 根据实际问题提出假设 规定显著性水平 确定原假设成立条件下统计量的抽样分布 计
14、算检验的统计量 按照决策规则作出决策非标准化临界值标准化临界值eCeCUL00,nxz/nsxt/LCx UCx 左单尾右单尾S 传统的假设检验的决策规则传统的假设检验的决策规则非标准化临界值标准化临界值12210221022,HHZZZHHZZZ接受拒绝拒绝接受 单側检验单側检验:1010,HHZ:ZHHZ:Z接受拒绝右接受拒绝左1 双側检验双側检验:1 消协接到消费者投诉,指控某品牌饮料容量不足,包装上标明的容量为500毫升。消协从市场随机抽取50袋,测得平均重量为498.35毫升,标准差4.33毫升。消协能否根据样本数据,判定是生产中的正常波动?还是厂家有意所为?显著性水平0.0575.
15、25033.450035.498=z500:H500=:96.1.05.0,5010nxHznWEIGHT508.3506.3504.3502.4500.4498.4496.4494.4492.5490.5121086420Std.Dev=4.33 Mean=498.3N=50.00标准化临界值标准化临界值)5033.4,500(x标准化临界值 某高校进行数学教学方法改革,组成一个实验班30人用新方法教学,在期末的统一考试中,实验班平均成绩为80 分,全年级平均77分,标准差12分,实验班的平均成绩与全年级平均成绩相比,是否显著提高?36.130127780=z77:H77:65.1.05.0
16、,3010nxH,zn单尾)3012,77(x非标准化临界值 双尾LCx 右单尾nZeULCxC0,H拒绝反之0H接受eCeCUL00左单尾UCx 0H拒绝0H拒绝优点:可对几个统计量同时进行检验优点:可对几个统计量同时进行检验 非标准化临界值例2.501,8.4982.15005033.41.96500)Z(96.1.05.0,500nzn包装上标明的容量为500毫升。消协从市场随机抽取50袋,测得平均重量为498.35毫升,标准差4.33毫升。在显著性水平取0.05时检验这批产品是否合格?P182(例6.1)188 指指 成立时,样本统计量的取值等于或超成立时,样本统计量的取值等于或超过所
17、观察到的值的概率过所观察到的值的概率。即否定。即否定 的最低显的最低显著著 性水平。性水平。反映实际观察到的数据与原假设之间不一致反映实际观察到的数据与原假设之间不一致程度的概率程度的概率(犯第一类错误的概率)(犯第一类错误的概率)。例如:P值=0.01,表明如果给定一个真实的零假设,检验统计量等于或超过实际观察到的极端值的概率是 0.01。0H现代检验方法:用P值(概值)进行检验0HP值的计算 右单尾检验P值=左单尾检验P值=双尾检验P值=)(00nxZP)(00nxZP)(200nxZP t分布的P值 一次概率论考试试题难度较大,出卷老师估计平均分约50分,随机抽取5份卷子,平均分65分,
18、标准差11.6分,求P值50:50:10HH025.0)89.2(89.25/6.115065tPt若原假设为真,样本均值高于65分的概率仅为2.5%(即求本次抽样高于65分的概率)p值的决策规则:值的决策规则:再做决定实际操作中增加样本量若必在接受域接受必在拒绝域拒绝,0000PxHPxHPP值0006.0)4970.05.0(*25033.450035.4980(5.0*2)50035.498(5.0(*235.498*2zpxpxpP值 第二节 单一样本的假设检验 -大样本下总体平均数的检验 例1(P191)某厂生产一种出口罐头,标准规格为每罐净重250克。根据以往经验,标准差为3克。随
19、机抽取100罐进行检验,称得其平均净重为251克。该批罐头是否合乎规格?)3.0,250(x33.31003250251=z250:H250=:96.1.05.0,10010nxHzn决策规则:如1 961 96.z则接受H0如-1.96zor 96.1 z则拒绝H0,接受H1结论:因为Z=3.33大于1.96,所以拒绝H0答:在显著性水平为0.05下,拒绝H0标准化临界值非标准化临界值25095%Z01.96-1.96统计量Z=3.33拒绝域拒绝域 C1C26.2503.096.125096.14.2493.096.125096.100nCnCUL决策规则:1H 0558.2502510H
20、0HLC 接受所以拒绝因否则拒绝接受如HUCxUCx251 249Z 3.33 3.33P值0008.0)4996.05.0(*210032502510(5.0*2)251250(5.0(*2251*2zpxpxp1.96 1.96 拒绝域拒绝域决策规则:P则统计量落在接受域里则接受H0p则统计量落在拒绝域里则拒绝H0250.6249.4 例2 某公司设计了一种充气包,这种充气包在发生交通事故时能对司机起到缓冲保护作用。该公司广告称该充气包在发生交通事故时不超过0.2秒钟即可将气包充好,现随机抽取100个样本,测得其平均充气时间为0.19秒,标准差为0.01秒,对该公司广告的真实性作出决策。0
21、5.02.0:2.0:10HHtailedright2.0:2.0:10HHtailedleft例2(右单尾检验).2.0:1H 2.0:H0.1x 30n 0.01=0.05,=19.0 x ,100服从正态分布n:.50 1.645,-10=z 40H 0H 1.645z.31010001.020.019.0=Z.2结论所以接受否则拒绝则接受如果计算统计量H1例2(左单尾检验).2.0:1H 2.0:H0.1x 30n 0.01=0.05,=19.0 x ,100服从正态分布n:.50H -1.645,-10=z 40H 0H-1.645z.31010001.020.019.0=Z.2结论
22、所以拒绝否则拒绝则接受如果计算统计量1 左单尾即置信区间下限检验问题:LLCxnzC19.0198355.01001.0645.12.00 0.19.0.198 0.2 00001645.001.001.02.019.0Hex拒绝P值检验(例2续)2.0 050:.1H ,0H.0.0.05=00105.0)010001.020.019.(5.019.0 秒不超过这种充气包的充气时间下在显著性水平为结论接受拒绝统计量落在拒绝域中值pzpzopXpP-1.645-100.05 例3 某药厂研制出一种降低胆固醇的新药,行业标准规定:患者服用此药一疗程后胆固醇平均下降30个单位以上,标准差不超过10
23、个单位为有效,才能投入生产。对100名患者进行药效观察,平均胆固醇下降了32个单位。该药是否可投入生产?05.030:30:10HHtailedleft30:30:10HHtailedright例3(左单尾检验)P168 0010H H 645.1.3210010/30-32=z 2.30 :30:.110,32x 100=n0.05,否则拒绝则接受如统计量zHH:.5H 1.6452=z .40结论接受-1.645拒绝域Z=2例3(右单尾检验)P168 0010H H 645.1.3210010/30-32=z 2.30 :30:.110,32x 100=n0.05,否则拒绝则接受如统计量
24、zHH:.5H 1.6452=z .40结论拒绝1.645拒绝域Z=2P 值检验法(例3续)0H 0228.001.00H 0228.005.00228.04772.05.02)zp(-0.5=)100/1030320(5.032则接受如则拒绝如值ppzppPx 100个银行职员样本的月收入个银行职员样本的月收入8300元,标准差元,标准差640元元,你是否能接受,你是否能接受“全体银行职员的平均月全体银行职员的平均月收入收入高高于于8000元元”?为为0.058000:8000:10HH8000:8000:10HH69.410064080008300=z65.165.1.05.0,100nx
展开阅读全文