书签 分享 收藏 举报 版权申诉 / 93
上传文档赚钱

类型抽样及抽样分布课件.ppt

  • 上传人(卖家):晟晟文业
  • 文档编号:4654276
  • 上传时间:2022-12-29
  • 格式:PPT
  • 页数:93
  • 大小:1.47MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《抽样及抽样分布课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    抽样 分布 课件
    资源描述:

    1、假设检验问题假设检验问题如果一个人说他是素食者。如何证明?如果一个人说他是素食者。如何证明?很难!很难!反反之之,如果要证明这个人吃过肉很容易,只要有一,如果要证明这个人吃过肉很容易,只要有一次就足够了。次就足够了。肯定什么事物很难,而否定却要相对容易得多。这肯定什么事物很难,而否定却要相对容易得多。这就是假设检验背后的哲学。就是假设检验背后的哲学。在假设检验中,要设立一个在假设检验中,要设立一个原假设原假设(“从未吃过肉从未吃过肉”就就是一个例子);是一个例子);而设立该假设的动机主要是利用人们掌握的反映现而设立该假设的动机主要是利用人们掌握的反映现实世界的数据来找出假设与现实之间的矛盾,从

    2、而实世界的数据来找出假设与现实之间的矛盾,从而否定否定这个假设。这个假设。假设检验的思想假设检验的思想从一个例子看假设检验的思想 例例:100个银行职员样本的月收入个银行职员样本的月收入8300元,元,你是否能接受你是否能接受“全体银行职员的平均月收入全体银行职员的平均月收入为为 8250元元?12000元元?8000元元”?很难说,因为如果很难说,因为如果“=8000元元”这个说法(假设)成这个说法(假设)成立,样本均值立,样本均值8300离离=8000不太近也不太远不太近也不太远,出现的可出现的可能性不好判断。能性不好判断。假设检验遵从假设检验遵从“小概率事件一次实验发生小概率事件一次实验

    3、发生概率极小概率极小”原则。原则。带有概率性质的反证法带有概率性质的反证法 统计推断统计推断参数估计假设检验通过样本统计量推断总体参数的置信区间利用样本信息判断对总体参数的假设值是否成立第六章 假设检验(参数检验)hypothesis testing 检验思想的逻辑:(20世纪30年代费歇尔提出)利用样本信息判断对总体参数的假设值是否成立 本章主要内容 假设的基本概念 显著性水平 假设检验的种类 假设检验中的两类错误 假设检验的规则 假设检验的步骤 单一总体的均值或比率的假设检验 两个总体均值或比率差异的假设检验 消协接到消费者投诉,指控某品牌饮料容量不足,包装上标明的容量为500毫升。消协随

    4、机抽取50代该种饮料,测得平均重量为498.35毫升,标准差4.33毫升。消协能否根据样本数据,判定是生产中的正常波动,还是厂家有意所为?生产线加工的产品废品率长期不超过1%,某日抽取100件,两件是废品,生产线是否正常?。?差异产生的原因:原因一:样本来自总体,样本差异源于由抽样的随机性 原因二:样本不属于已知总体,差异源于总体本身假设检验的步骤 根据实际问题提出假设根据实际问题提出假设 给定显著性水平给定显著性水平 确定原假设成立条件下统计量的抽样分布确定原假设成立条件下统计量的抽样分布 计算检验的统计量计算检验的统计量 根据检验统计量的结果根据检验统计量的结果,按照检验规则作出决策按照检

    5、验规则作出决策第一节 假设检验的概念 一 假设检验的有关概念 假设假设:关于总体参数值的一种看法或陈述关于总体参数值的一种看法或陈述 零假设(零假设(Null hypothesisNull hypothesis)接受检验的基本假设,)接受检验的基本假设,带等号:带等号:no change no differenceno change no difference 据样本数据结果欲推翻的假设据样本数据结果欲推翻的假设 备择假设(备择假设(AlternatihypothesisAlternatihypothesis)零假设的对立假设,)零假设的对立假设,不带等号:不带等号:250:250=:=:10

    6、0100HHHH、据样本数据结果欲支持的假设据样本数据结果欲支持的假设二 假设检验的种类 双尾检验:拒绝域在两侧 单尾检验:拒绝域在一側 左单尾检验:拒绝域在左側 右单尾检验:拒绝域在右側0100:HH0100:HH0100:HH0100:HH0100:HH0100:HH怎样建立零假设和备择假设 对某种标准是否符合进行检验对某种标准是否符合进行检验:将标准作为原假设将标准作为原假设.例:某机床配件的规格为1.5毫米,委托外企业加工,对加工后的配件进行检验,检验研究结果检验研究结果:研究者对研究结果的假设设为备择假,研究者对研究结果的假设设为备择假,备择假设应该按照实际世界所代表的方向来确定备择

    7、假设应该按照实际世界所代表的方向来确定 某医药研究机构发明一种治疗感冒的新药,以往感冒药效持续时间最长可达24小时,对新药持续时间检验 对某种观点有效性的检验对某种观点有效性的检验:(相信与否)相信与否)某电脑显示器制造商申称,其寿命不低于10000小时 10000:10000:10HH24:24:10HH5.1:1.5=:10HH10000:10000:10HH关于设立假设的讨论 购货方与销货方双方协定,产品的次品率高于3%,则购货方可以退货,如果你是购货方,对产品质量进行检验:如果销货方一贯信誉很好,如何假设?如前例:如果销货方信誉不太好,如何假设?如前例 左右都可以设,看先验信息、依据背

    8、景考虑:严格:反方向设;宽松:顺方向设 零假设是研究者想用证据推翻的内容零假设是研究者想用证据推翻的内容 备择假设是研究者想用证据支持的内容备择假设是研究者想用证据支持的内容 一对假设的设立会体现研究者的主观意愿一对假设的设立会体现研究者的主观意愿 例 某公司设计了一种充气包,这种充气包在发生交通事故时能对司机起到缓冲保护作用。该公司广告称该充气包在发生交通事故时不超过0.2秒钟即可将气包充好,现随机抽取100个样本,测得其平均充气时间为0.19秒,标准差为0.01秒,对该公司广告的真实性作出决策。05.02.0:2.0:10HHtailedright2.0:2.0:10HHtailedlef

    9、t表述方法1表述方法2假设H0:0.2秒H0:0.2秒H1:0.2秒H1:0.2秒生产的充气包的平均充气时间不超过0.2秒,但却拒绝了H0认为不合格。这使厂商失去业务机会。充气包的平均充气时间超过0.2秒,但却拒绝了H0,认为合格,这势必导致人身伤亡,并导致商誉严重损失。型错误平均充气时间超过0.2秒,但却认为其低于0.2秒,而接受H0。这势必导致人身伤亡,并导致商誉严重损失。平均充气时间不超过0.2秒,但却接受了H0,认为超过了0.2秒,不合格。这使厂商失去业务机会。型错误态度努力防止将合格产品误判为不合格的风险,重在保护厂商利益。努力防止将不合格产品误判合格的风险,重在保护消费者利益。三、

    10、显著性水平 小概率事件发生的概率。(小概率事件在一次实验中发生的概率很小).原假设是正确而根据样本的信息却拒绝了原假设的概率,也叫拒绝域。根据实际问题事先确定,一般取 0.01,0.05,0.10。检验结果显著(significant)意味着有理由拒绝零假设。因此,假设检验也被称为显著性检验(significant test)。表明样本统计量和总体参数的差异显著设的概率是接受一个正确的零假1 拒绝/接受域的图示025.0205.021拒绝域 拒绝域x250,=:0H接受域10.090.0190.0110.0显著性水平越小,越不容易拒绝原假设,显著性水平越大,越容易拒绝原假设,很小/大的显著性水

    11、平说明什么95.01025.0205.021 拒绝域 拒绝域 四、两类错误两类错误 第一型错误(弃真错误)原假设为真,样本信息提供拒绝原假设的统计证据。拒绝一个正确的原假设.犯这个错误的概率为 即显著性水平.统计中将只控制I型错误,不考虑错误的检验称显著性检验 第二型错误(取伪错误)备择假设为真,样本信息提供不能拒绝原假设的统计证据。接受了一个错误的原假设,犯这个错误的概率为的概率拒绝一个错误的原假设:1零假设备择假设哪个正确?有可能犯错误的是?一个小概率事件出现,因此拒绝原假设。a值越大,表明犯弃真错误的概率越大,越容易拒绝原假设,此时称检验越严格。如果在型错误的概率为5或1下拒绝原假设,说

    12、明100次拒绝原假设结论中,平均有5次或1次是错误的。a值需要由检验目的来确定,当取伪造成的损失大于弃真造成的损失时,应扩大a值。显著性水平的给定对检验结果有一定影响,在一个水平下是显著成立的,在另一个水平下可能不成立。这正是统计学意义上的结论的严格性与科学性所在。的关系和 反方向变动 同时减少犯两种错误的概率 奈曼和皮尔逊提出:在控制 I 型错误的概率的条件下,尽量使 II 型错误的概率减少。01两类两类错误的关系错误的关系好的检验法则:如果减小拒绝域,就意味着扩大接受域,从而扩大了犯取伪错误的概率。弃真和取伪是一对矛盾1)扩大样本量,2)使用更好的统计量,才可以使二者同时缩小 nsxz/检

    13、验统计量是数据的代表 根据原假设可知检验统计量的分布 检验统计量的实现值是否小概率事件 小概率事件发生了,称检验结果显著 原假设和备择假设并不对称 假设检验与区间估计的关系 (在 接受原假设,则 必覆盖总体参数)nxz/nsxt/检验统计量1 五、假设检验的决策结果:原假设真实,样本数据支持接受原假设 原假设不真实,样本数据不支持接受原假设 原假设真实,样本数据不支持接受原假设 原假设不真实,样本数据支持接受原假设 为真 不真实 接受 拒绝 判断正确 弃真 错误取伪错误 判断正确0H0H0H0H 传统假设检验的步骤 根据实际问题提出假设 规定显著性水平 确定原假设成立条件下统计量的抽样分布 计

    14、算检验的统计量 按照决策规则作出决策非标准化临界值标准化临界值eCeCUL00,nxz/nsxt/LCx UCx 左单尾右单尾S 传统的假设检验的决策规则传统的假设检验的决策规则非标准化临界值标准化临界值12210221022,HHZZZHHZZZ接受拒绝拒绝接受 单側检验单側检验:1010,HHZ:ZHHZ:Z接受拒绝右接受拒绝左1 双側检验双側检验:1 消协接到消费者投诉,指控某品牌饮料容量不足,包装上标明的容量为500毫升。消协从市场随机抽取50袋,测得平均重量为498.35毫升,标准差4.33毫升。消协能否根据样本数据,判定是生产中的正常波动?还是厂家有意所为?显著性水平0.0575.

    15、25033.450035.498=z500:H500=:96.1.05.0,5010nxHznWEIGHT508.3506.3504.3502.4500.4498.4496.4494.4492.5490.5121086420Std.Dev=4.33 Mean=498.3N=50.00标准化临界值标准化临界值)5033.4,500(x标准化临界值 某高校进行数学教学方法改革,组成一个实验班30人用新方法教学,在期末的统一考试中,实验班平均成绩为80 分,全年级平均77分,标准差12分,实验班的平均成绩与全年级平均成绩相比,是否显著提高?36.130127780=z77:H77:65.1.05.0

    16、,3010nxH,zn单尾)3012,77(x非标准化临界值 双尾LCx 右单尾nZeULCxC0,H拒绝反之0H接受eCeCUL00左单尾UCx 0H拒绝0H拒绝优点:可对几个统计量同时进行检验优点:可对几个统计量同时进行检验 非标准化临界值例2.501,8.4982.15005033.41.96500)Z(96.1.05.0,500nzn包装上标明的容量为500毫升。消协从市场随机抽取50袋,测得平均重量为498.35毫升,标准差4.33毫升。在显著性水平取0.05时检验这批产品是否合格?P182(例6.1)188 指指 成立时,样本统计量的取值等于或超成立时,样本统计量的取值等于或超过所

    17、观察到的值的概率过所观察到的值的概率。即否定。即否定 的最低显的最低显著著 性水平。性水平。反映实际观察到的数据与原假设之间不一致反映实际观察到的数据与原假设之间不一致程度的概率程度的概率(犯第一类错误的概率)(犯第一类错误的概率)。例如:P值=0.01,表明如果给定一个真实的零假设,检验统计量等于或超过实际观察到的极端值的概率是 0.01。0H现代检验方法:用P值(概值)进行检验0HP值的计算 右单尾检验P值=左单尾检验P值=双尾检验P值=)(00nxZP)(00nxZP)(200nxZP t分布的P值 一次概率论考试试题难度较大,出卷老师估计平均分约50分,随机抽取5份卷子,平均分65分,

    18、标准差11.6分,求P值50:50:10HH025.0)89.2(89.25/6.115065tPt若原假设为真,样本均值高于65分的概率仅为2.5%(即求本次抽样高于65分的概率)p值的决策规则:值的决策规则:再做决定实际操作中增加样本量若必在接受域接受必在拒绝域拒绝,0000PxHPxHPP值0006.0)4970.05.0(*25033.450035.4980(5.0*2)50035.498(5.0(*235.498*2zpxpxpP值 第二节 单一样本的假设检验 -大样本下总体平均数的检验 例1(P191)某厂生产一种出口罐头,标准规格为每罐净重250克。根据以往经验,标准差为3克。随

    19、机抽取100罐进行检验,称得其平均净重为251克。该批罐头是否合乎规格?)3.0,250(x33.31003250251=z250:H250=:96.1.05.0,10010nxHzn决策规则:如1 961 96.z则接受H0如-1.96zor 96.1 z则拒绝H0,接受H1结论:因为Z=3.33大于1.96,所以拒绝H0答:在显著性水平为0.05下,拒绝H0标准化临界值非标准化临界值25095%Z01.96-1.96统计量Z=3.33拒绝域拒绝域 C1C26.2503.096.125096.14.2493.096.125096.100nCnCUL决策规则:1H 0558.2502510H

    20、0HLC 接受所以拒绝因否则拒绝接受如HUCxUCx251 249Z 3.33 3.33P值0008.0)4996.05.0(*210032502510(5.0*2)251250(5.0(*2251*2zpxpxp1.96 1.96 拒绝域拒绝域决策规则:P则统计量落在接受域里则接受H0p则统计量落在拒绝域里则拒绝H0250.6249.4 例2 某公司设计了一种充气包,这种充气包在发生交通事故时能对司机起到缓冲保护作用。该公司广告称该充气包在发生交通事故时不超过0.2秒钟即可将气包充好,现随机抽取100个样本,测得其平均充气时间为0.19秒,标准差为0.01秒,对该公司广告的真实性作出决策。0

    21、5.02.0:2.0:10HHtailedright2.0:2.0:10HHtailedleft例2(右单尾检验).2.0:1H 2.0:H0.1x 30n 0.01=0.05,=19.0 x ,100服从正态分布n:.50 1.645,-10=z 40H 0H 1.645z.31010001.020.019.0=Z.2结论所以接受否则拒绝则接受如果计算统计量H1例2(左单尾检验).2.0:1H 2.0:H0.1x 30n 0.01=0.05,=19.0 x ,100服从正态分布n:.50H -1.645,-10=z 40H 0H-1.645z.31010001.020.019.0=Z.2结论

    22、所以拒绝否则拒绝则接受如果计算统计量1 左单尾即置信区间下限检验问题:LLCxnzC19.0198355.01001.0645.12.00 0.19.0.198 0.2 00001645.001.001.02.019.0Hex拒绝P值检验(例2续)2.0 050:.1H ,0H.0.0.05=00105.0)010001.020.019.(5.019.0 秒不超过这种充气包的充气时间下在显著性水平为结论接受拒绝统计量落在拒绝域中值pzpzopXpP-1.645-100.05 例3 某药厂研制出一种降低胆固醇的新药,行业标准规定:患者服用此药一疗程后胆固醇平均下降30个单位以上,标准差不超过10

    23、个单位为有效,才能投入生产。对100名患者进行药效观察,平均胆固醇下降了32个单位。该药是否可投入生产?05.030:30:10HHtailedleft30:30:10HHtailedright例3(左单尾检验)P168 0010H H 645.1.3210010/30-32=z 2.30 :30:.110,32x 100=n0.05,否则拒绝则接受如统计量zHH:.5H 1.6452=z .40结论接受-1.645拒绝域Z=2例3(右单尾检验)P168 0010H H 645.1.3210010/30-32=z 2.30 :30:.110,32x 100=n0.05,否则拒绝则接受如统计量

    24、zHH:.5H 1.6452=z .40结论拒绝1.645拒绝域Z=2P 值检验法(例3续)0H 0228.001.00H 0228.005.00228.04772.05.02)zp(-0.5=)100/1030320(5.032则接受如则拒绝如值ppzppPx 100个银行职员样本的月收入个银行职员样本的月收入8300元,标准差元,标准差640元元,你是否能接受,你是否能接受“全体银行职员的平均月全体银行职员的平均月收入收入高高于于8000元元”?为为0.058000:8000:10HH8000:8000:10HH69.410064080008300=z65.165.1.05.0,100nx

    25、:z,:zn右左单尾右尾接受原假设,左尾拒绝原假设,结论相同,逻辑不同例4 一种零件标准寿命应达到1200小时以上,标准差为300小时,随机抽取100件,平均寿命为1245小时。在显著性水平0.05下确定这批零件是否合格?0668.01249100300645.11200645.15.13012001245645.1,1200:1200:010值单尾pnZZZHH小样本下总体平均数的假设检验例5 某校有自主招生资格,自主招生笔试考核后,招生办估计数学的平均成绩至少为90分.从中随机抽出20份,平均成绩为83分,样本标准差为12分.试在0.01的显著性水平下检验招生办所做的推测是否正确.6.0H

    26、-2.539,-2.609=t.50H 539.2,0H 539.2 .4539.2*.19 20=n 0.01=.3609.220129083.290:1H 90:0H.1,.01.0,83X 12,=s 20,=n结论所以拒绝则接受如果则拒绝执行如果值查表得临界值自由度统计量分布服从且小样本所以未知ttptnSXttx例P201总体平均数的假设检验 例6 某银行对各个网点的业务员的服务进行评价,问卷中采用李克特量表(0-10),规定7分以上为优秀,在某网点随机抽取的当日60份业务员的电子记录结果,平均7.25分,标准差1.052,该网点是否可以评为优秀?6.0H,67184.1=t.50H

    27、 671.1,0H 671.1 .4671.1.59 60=n 0.05=.384.160052.1725.7.27:1H 7:0H.1,.05.0,25.7X 1.052,=s 60,=n结论所以拒绝则接受如果则拒绝如果值查表得临界值自由度统计量分布服从大样本未知。ttptnSXttx,如果此例用正态统计量检验如果此例用双尾检验总体比率的假设检验例7 某企业的产品畅销于国内市场。据以往资料,购买该产品的顾客有50%是男性。该企业的负责人关心这个比率是否发生了变化,于是该企业委托一家咨询机构进行调查,这家咨询机构从众多的购买者中随机抽选了400名进行调查,结果有210名为男性,检验“50%的顾

    28、客是男性”的观点。显著性水平为0.05:.7 1.96,1=z.6,96.196.1.514005.015.05.0525.0-p=z 4.p 520015200=0.5400=n .3525.0400210=p 0.05,=400,=n 2.0.5:H 5.0 :H.1000p10结论接受否则拒绝则接受如服从正态分布且HHHzn样本量大小对检验结果的影响 某种产品要求其使用寿命不得低于某种产品要求其使用寿命不得低于1000小时。已知这种元件的小时。已知这种元件的寿命服从标准差为寿命服从标准差为100小时的正态分布。现中随机抽查了小时的正态分布。现中随机抽查了25件,件,测得平均使用寿命为测得

    29、平均使用寿命为972小时。小时。1、在、在0.05的显著性水平下,检验这批产品是否合格;的显著性水平下,检验这批产品是否合格;2、如果抽取、如果抽取50件样本进行检查,在其它条件不变的情况下,件样本进行检查,在其它条件不变的情况下,检验这批产品是否合格。检验这批产品是否合格。假设:1000,:1000 -1.4,P值P(Z-1.4)0.0808 -1.98,P值P(Z-1.98)0.023850H 1H 251001000972nxZ501001000972 nxZ为什么结论不一致?分母大小不同意味什么 某农场为了试验某种农作物的新品种是否会比原品种的产量更高,分别在若干块面积为0.1亩的试验

    30、地进行试种,每块试验地上所收获的产量如下表(单位:kg)。假定产量服从正态分布且两种品种产量的方差相等,在5的显著性水平下,1、新品种与原品种的产量有显著差异?2、新品种比原品种的产量有显著提高?单双尾检验对决策结果的影响0:0:211210HH原品种111089971071121209810310192 95新品种211810792116110105106112124 0:0:211210HH1、新品种与原品种的产量有显著差异?2、新品种比原品种的产量有显著提高?I In nd de ep pe en nd de en nt t S Sa am mp pl le es s T Te es s

    31、t t.108.746-1.87618.077-7.818184.16769-16.57418.93781-1.87917.345.077-7.818184.15972-16.58114.94478Equal variancesassumedEqual variancesnot assumedVAR00001FSig.Levenes Test forEquality of Variancestdf Sig.(2-tailed)MeanDifferenceStd.ErrorDifference LowerUpper95%ConfidenceInterval of theDifferencet-t

    32、est for Equality of Means错误的计算 某IT公司以往的职工平均年龄为33.5岁,现了解这个平均年龄是否发生了变化,抽取250人,=34.8岁,已知=14.2岁在=0.05条件下检验该职工平均年龄是否发生变化。解:平均数大样本双尾检验(已知)。H0:=33.5 H1:33.5 =0.05 z=1.96抽样标准误=0.898临界值 33.5 1.960.898 31.7,35.3决策规则:若 31.7或 35.3,拒绝H0;若31.7 35.3,接受H0 因为 =34.8,所以接受H0 xxxxx如果真值=34.5岁x =P(接受H0|=34.5)=(31.7 35.3|=

    33、34.5)=P31.7 34.5+P34.5 35.3 =P z 0+P0z =P3.12z 0+P0z 0.89 =0.4991+0.3133 =0.8124 当=34.5时,错误地接受H0:=33.5的概率为81.24%。这个概率较大,是因为=34.5这个真实的参数值很接近假设的=33.5参数值,很难区分假设值与真值的差异,即很容易犯型错误。xx250/2.145.343.35250/2.145.347.31功效曲线0dnormx01()dnormx21()x420200.20.4nz0nz0 xdennxnznz200)2(21单一样本(总体)假设检验总结单一总体平均数 平均数 比率Z检

    34、验1or2 tailt 检验1or2 tailZ检验1or2 tail 未知小样本未知小样本 已知已知 第三节 双样本假设检验 一 配对样本(matched pairs两种配对方法两种配对方法)设 为各对观察值之差 1)(,nddSnddidid独立样本配对样本21d)()(:)(:,:)(:21,10.1010dddddddLtailHHRtailHHTtailHH为假设参数值)1,0(1ndZtnnSdtdd大样本下检验统计量分布的服从小样本下检验统计量 例:某健美俱乐部在广告中称,在该俱乐部参加一期训练班至少减少体重17斤,为验证其广告的真实性,调查人员随机抽取了10位参加者,资料如下:

    35、在 水平下,判断参加一期训练班是否至少减肥17斤?训练前 189 202 220 207 194 177 193 202 208 233训练后 170 179 203 192 172 161 174 187 186 204差 值d 19 23 17 15 22 16 19 15 22 29 05.0两均值差异的假设检验(配对样本)10)9()9(211210,83.194.1,833.1,05.094.139.17.2104.4177.194.41)(,7.1910/19717:17:HHndtnddSnddHHtttsd接受拒绝1 2 3 4 5 非标准临界值广告是正确的接受拒绝结论拒绝接受

    36、,:55.197.1955.1955.1955.1939.1*883.117*1000)9(HHxHxHxstd两总体均值差异的假设检验(独立样本)-观察两个总体的参数是否具有显著区别 两总体标准差已知或大样本 两总体标准差未知但相等(计算合并统计量)两总体标准差未知但不相等假设形式:双尾 左单尾 右单尾0:0:211210HH0:0:211210HH0:0:211210HH两总体标准差已知或大样本 两总体服从正态分布,已知 两总体为任意分布,未知,但样本容量足够大。服从或近似服从正态分布:检验统计量:21,21,)(21xx 2221212121)()(nnxxZ2221212121)()(

    37、nsnsxxZ例P207004.0)88.20(5.02)88.2(243.543.543.577.2*96.1088.277.2117125)()(212221212121zpzppxxCnsnsxxZ值0:0:211210HH)(222121,2121nsnsNxx两总体标准差未知但相等(计算合并统计量)无偏估计量是对两样本方差计算加权平均22122121)()(nsnsxxtpp2)1()1(212222112nnsnsnsP2Ps221 nn为合并估计量(pooled estimator)。自由度为的T分布两总体方差未知且不相等 由 直接计算统计量 2221212121)()(nsns

    38、xxt)1()1()(22242121412222121nnsnnsnsns2221ss 和Levenes Test forQuality of variancet-test for Equality of MeansFSig.tdfSig.(2-tailed)MeandifferenceStd.ErrorDifferenceEqual variance assumed.02.9642.30444.048.7394.0.3636Equalvariance not assumed2.01340.582.051.7394.0.3673Group Statistics213.27141.3027.2

    39、843252.53201.1629.2326股种纽约纳斯达克收益率NMeanStd.DeviationStd.ErrorMeanP210两比率差异的假设检验(独立大样本)-两个总体比率是否相等 双尾 右单尾 左单尾0:,0:211210HH0:,0:211210HH0:,0:211210HH 5,)11)(1()1()1(,:212121212211212,12121npnnPpppZnppnppSnnnpnppppPP的合并统计量作为的加权平均数用两总体比率相等地区问卷份数欲购买家庭数A15075B2001030:,0:211210HH515.0200/103,5.0150/7521pp55

    40、086.0*350,5086.0np054.0)1()1(2121nppnppSpp例:调查了两个地区居民欲购买液晶电视的意向,数据如下:2121211nnpnpnP01.0015.05.0515.021 pp13905.0,13905.0015.0 双样本(总体)假设检验总结为一不为零的常数计算合并统计量为零比率差异两总体方差不相等合并统计量)两总体方差相等(计算未知样本小已知大独立样本大样本小样本配对样本平均数差异pnZt30,)(本章完假设检验的过程和逻辑假设检验的过程和逻辑先提出原假设,比如=5。这种原假设也称为零假设(null hypothesis),记为H0。再提出备择假设(alt

    41、ernative hypothesis),比如 5。备选假设记为H1,通常是被认为可能比零假设更符合数据所代表的现实。比如上面的H1为5;这意味着,样本均值应该大于5;至于是否显著,依检验结果而定。检验结果显著(significant)意味着有理由拒绝零假 设。故 假 设 检 验 也 被 称 为 显 著 性 检 验(significant test)。5:5:10HH假设检验的过程和逻辑有了两个假设,就要根据数据来对它们进行判断。数据的代表是作为其函数的统计量;它在检验中被称为检验统计量(test statistic)。根据零假设(不是备选假设!),可得到该检验统计量 的 分 布;再 看 这

    42、个 统 计 量 的 数 据 实 现 值(realization)属不属于小概率事件。也就是说把数据代入检验统计量,看其值是否落入零假设下的小概率范畴;如果的确是小概率事件,那么就有可能拒绝零假设,或者说“该检验显著,”否则说“没有足够证据拒绝零假设”,或者“该检验不显著。”假设检验的过程和逻辑在零假设下,检验统计量实现值及(沿着备选假设的方向)更加极端值的概率称为p值(p-value)。如果得到很小的p值,就意味着在零假设下小概率事件发生了。如果小概率事件发生,是相信零假设,还是相信数据呢?当然多半是相信数据,拒绝零假设。假设检验的过程和逻辑归纳起来,假设检验的逻辑步骤为:归纳起来,假设检验的

    43、逻辑步骤为:1.写出零假设和备选假设;写出零假设和备选假设;2.确定检验统计量;确定检验统计量;3.确定显著性水平确定显著性水平;4.根据数据计算检验统计量的实现值;根据数据计算检验统计量的实现值;5.根据这个实现值计算根据这个实现值计算p-值;值;6.进行判断:如果进行判断:如果p-值小于或等于值小于或等于,就拒绝零假设,就拒绝零假设,这时犯(第一类)错误的概率最多为这时犯(第一类)错误的概率最多为;如果;如果p-值大值大于于,就不拒绝零假设,因为证据不足。,就不拒绝零假设,因为证据不足。假设检验的过程和逻辑多 数 计 算 机 软 件 有 的 直 接 给 出 p-值,有 的 用signifi

    44、cant的缩写“Sig”。使用户使用非常方便之处。比如=0.05,而假定所得到的p-值等于0.001。这时如果采用p-值作为新的显著性水平,即新的=0.001,于是就可以说,在显著性水平为0.001时,拒绝零假设。这样,拒绝零假设时犯错误的概率实际只是千分之一而不是旧的所表明的百分之五。在这个意义上,p值又称为观测的显著性水平(observed significant level)。假设检验的过程和逻辑使用临界值是前计算机时代的产物。当时计算p-值不易,只采用临界值的概念。但从给定的求临界值同样也不容易,好在习惯上仅仅在教科书中列出相应于特定分布的几个有限的临界值(比如=0.05,=0.025

    45、,=0.01,=0.005,=0.001等等),或者根据分布表反过来查临界值(很不方便也很粗糙)。现在计算机软件都给出p值和统计量的实现值,让用户自己决定显著性水平是多少。假设检验的过程和逻辑 并不一定越小越好,因为这很可能导致不容易拒绝零假设,使得犯第二类错误的概率增大。当p-值小于或等于时,就拒绝零假设。所以,是所允许的犯第一类错误概率的最大值。当p-值小于或等于时,就说这个检验是显著的。无论统计学家用多大的作为显著性水平都不能脱离实际问题的背景。统计显著不一定等价于实际显著。反过来也一样。)(:,:)(:,:)(:,:211210211210211210左尾右尾双尾为假设常数值dHdHd

    46、HdHdHdHd两总体比率之差为一不为零的常数两总体比率之差为一不为零的常数 例:对两个班学生参加新东方英语培训情况进行调查:结果如下 一班:调查45人,参加人数19人 二班:调查65人,参加人数23人 能否据调查结果认为一班学生参加新东方英语培训的比率高于二班5%?05.0即不支持这种观点不能拒绝接受服从正态分布,645.11946.01946.065%62.64*38.354578.57*%22.42%5%)38.35%11.42()1()1()(645.105.0,)(542)1(,523526)1(,519%38.356523%,22.42451905.0:,05.0:00222111

    47、2121222211121211210HHZZnppnppdppZZpppnpnpnpnppHH 某农场为了试验某种农作物的新品种是否会比原品种的产量更高,分别在若干块面积为0.1亩的试验地进行试种,每块试验地上所收获的产量如下表(单位:kg)。假定产量服从正态分布且两种品种产量的方差相等,在5的显著性水平下,1、新品种与原品种的产量有显著差异?2、新品种比原品种的产量有显著提高?单双尾检验对决策结果的影响0:0:211210HH原品种111089971071121209810310192 95新品种211810792116110105106112124 0:0:211210HH1、新品种与原

    48、品种的产量有显著差异?2、新品种比原品种的产量有显著提高?H0:=35 H1:35?原假设;原假设;备择假设;备择假设;选择的态度:拒绝?接受?选择的态度:拒绝?接受?对容量为对容量为100的样本,的样本,原假设,原假设H0 是否成立。是否成立。由抽样分布知道,如果由抽样分布知道,如果 H0成立,则成立,则 服从服从 N(0,1)分分布。布。8300 x108000snsxxZ给定给定 =0.05 则有则有即即 或或 区域是小概率事区域是小概率事件件,也即也即 或或是小概率事件。是小概率事件。但是已知但是已知 ,小概率事件发生了,小概率事件发生了,这是这是一个矛盾一个矛盾,拒绝拒绝 H0:=35。05.096.1800010sxPnSx96.135nSx96.1353196.1351041.20 x04.3996.135nSx3145.29x 75.25033.450035.498=z500:H500=:96.1.05.0,5010nxHzn检验统计量落入拒绝域,该厂商有欺骗行为36.130127780=z77:H77:65.1.05.0,3010nxH,zn单尾检验统计量落入接受域,实验班成绩显著提高

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:抽样及抽样分布课件.ppt
    链接地址:https://www.163wenku.com/p-4654276.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库