书签 分享 收藏 举报 版权申诉 / 122
上传文档赚钱

类型重点统计学课件之9-抽样推断-122页PPT.ppt

  • 上传人(卖家):三亚风情
  • 文档编号:3180434
  • 上传时间:2022-07-29
  • 格式:PPT
  • 页数:122
  • 大小:1.90MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《重点统计学课件之9-抽样推断-122页PPT.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    重点 统计学 课件 抽样 推断 122 PPT
    资源描述:

    1、平均误差的计算公式平均误差的计算公式平均误差(采用重复抽样)平均误差(采用重复抽样)nx平均误差(采用不重复抽样误差公式)平均误差(采用不重复抽样误差公式)NnnNnNnx1122nPPp1NnnPPNnNnPPp1111抽样极限误差抽样极限误差xXxxX抽样平均数极限误差抽样平均数极限误差:Ppp抽样成数极限误差抽样成数极限误差;xxt;ppt;xxt;ppt即,抽样极限误差是抽样平均误差的多少倍。我们把倍数t称为抽样误差的概率度抽样误差的概率度抽样误差的概率度抽样估计的置信度l抽样估计的置信度就是表明样本指标抽样估计的置信度就是表明样本指标与总体指标的误差不超过一定范围的与总体指标的误差不

    2、超过一定范围的概率保证程度,它一般用概率保证程度,它一般用F F(t t)表示。表示。又称抽样估计的概率保证程度。又称抽样估计的概率保证程度。1、总体平均数抽样估计的置信度、总体平均数抽样估计的置信度2、总体成数抽样估计的置信度、总体成数抽样估计的置信度)()(tFtXxPxx)()(tFtxXtxPxx)()(tFtPpPpp)()(tFtpPtpPpp总体平均数总体平均数(成数成数)的区间估计的区间估计xxxxxxXxXx,或,其中,其中,为极限误差为极限误差xxtppppppPpPp,或,其中,其中,为极限误差为极限误差ppt抽样估计方法抽样估计方法n以样本的平均数以样本的平均数 作为总

    3、体作为总体平均数平均数 的估计值。的估计值。n以样本的成数以样本的成数 p 作为总体成数作为总体成数 P 的估计值。的估计值。xX(一一)点估计(定值估计)点估计(定值估计)它是直接以样本指标的实际值直它是直接以样本指标的实际值直接作为相应总体参数的估计值。接作为相应总体参数的估计值。例如:例如:(二)区间估计(二)区间估计区间估计的基本特点及要素区间估计的基本特点及要素 区间估计的基本特点 根据给定的概率保证度,利用实际抽根据给定的概率保证度,利用实际抽样资料,指出总体参数可能存在的区间范样资料,指出总体参数可能存在的区间范围。这个区间称为置信区间。围。这个区间称为置信区间。区间估计必须具备

    4、的三个要素 (1)估计值)估计值 (2)抽样误差范围)抽样误差范围 (3)概率保证程度)概率保证程度 估计区间的上下限估计区间的上下限:或:或置信区间置信区间:或:或概率保证度(置信度)概率保证度(置信度):x x xx ,pp xx pp pp ,)tXx(P)t(Fx 根据所给条件不同有两种模式根据所给条件不同有两种模式一是根据给定可信度的要求来估计极限误一是根据给定可信度的要求来估计极限误差的可能范围(置信区间)差的可能范围(置信区间)二是根据给定的抽样极限误差范围,求概二是根据给定的抽样极限误差范围,求概率保证程度率保证程度1根据根据(t)求及置信区间求及置信区间n 根据样本资料,计算

    5、出及根据样本资料,计算出及n 或或p及。及。n 根据根据F(t)查正态分布概率表求查正态分布概率表求t;n 根据根据t与,计算或与,计算或,指出置信区间为:指出置信区间为:x xt xx xx ,p,p pp pt x 或或p【例例】对某鱼塘进行抽样调查,从鱼塘的不同对某鱼塘进行抽样调查,从鱼塘的不同部位共网到鱼部位共网到鱼150条,其中草鱼条,其中草鱼123条,条,草鱼平均每条重草鱼平均每条重2公斤,标准差为公斤,标准差为0.75公斤。公斤。1)试按试按95.45%(t=2)的概率保证程度,的概率保证程度,对该鱼塘草鱼平均每条重量作区间估计;对该鱼塘草鱼平均每条重量作区间估计;2)以同样的概

    6、率保证程度对该鱼塘草鱼所以同样的概率保证程度对该鱼塘草鱼所占比重作区间估计。占比重作区间估计。解解 1)已知:已知:草鱼平均每条重量的估计区间为:草鱼平均每条重量的估计区间为:即即20.14,20.14 1.86,2.14公斤公斤 x)(14.012375.02t2xx公公斤斤 12375.0nsn222x xx (公斤公斤)=2kg,s=0.75kg,n=123,t=2解解2)已知已知:n=150,t2,p123/15082%1500.180.82np)p(1nP)P(1p%27.615018.082.02tpp pp 则草鱼所占比重的估计区间为则草鱼所占比重的估计区间为:即即82%6.27

    7、%,82%6.27%75.73%,88.27%例:某乡水稻总面积例:某乡水稻总面积1666.7公顷,以公顷,以不重复抽样不重复抽样方方法从中随机抽取法从中随机抽取33.3公顷实割实测,求得样本平公顷实割实测,求得样本平均公顷产量为均公顷产量为9600公斤,标准差为公斤,标准差为71.5公斤。公斤。以以95.45%的概率保证程度,对该乡水稻公顷产的概率保证程度,对该乡水稻公顷产量和总产量作出估计。量和总产量作出估计。解:(1)抽取样本,计算样本平均公顷产量和标准差。公斤公斤公顷公斤3.12)7.16663.331(3.335.71)1(5.71/960022NnnSSxx(2)根据给定的概率可信

    8、度)根据给定的概率可信度0.9545,查概率表,查概率表 得得t=2.(3)计算极限误差,据此计算粮食平均公顷产量)计算极限误差,据此计算粮食平均公顷产量 的上下限,以及粮食总产量的上下限。的上下限,以及粮食总产量的上下限。万公斤粮食总产量上限万公斤粮食总产量下限公斤平均公顷产量上限公斤平均公顷产量下限公斤16046.96241666.715964.95751666.76.96246.2496004.95756.2496006.243.122xxxxxxt例:某服装公司设计新时装,为了预测服装销路,在例:某服装公司设计新时装,为了预测服装销路,在市场上随机对市场上随机对480成年人进行调查,结

    9、果有成年人进行调查,结果有336人人喜欢新时装。要求以喜欢新时装。要求以90%的概率保证程度,估计的概率保证程度,估计该市成年人喜欢新时装的比率。该市成年人喜欢新时装的比率。解:(1)根据样本资料计算%1.24803.07.0)1(%8.453.07.0)1(%70480336nppppSpp(2)根据给定的可信度F(t)=0.9,查概率表 得t=1.64(3)计算极限误差范围,确定总体比率的上下限。%44.73%44.3%70p%56.66%44.3%70-p%44.3%1.264.1ppppt上限下限2根据给定的,求根据给定的,求F(t)n抽取样本,计算出抽取样本,计算出、s,推算推算出;

    10、出;n根据,估计出根据,估计出n根据,求出根据,求出F(t)xx xx xxt 随机抽取随机抽取25亩水稻田,测得平亩水稻田,测得平均亩产为均亩产为650公斤,标准差为公斤,标准差为75公公斤,求总体平均亩产在斤,求总体平均亩产在620-680斤斤之间的概率是多少?之间的概率是多少?【例】【例】【解】【解】所以所以 F(t)=95.45%。)(650 x斤斤)(152575nsn222x公公斤斤 )(3026206802)x()x(xxx公公斤斤 21530txx 已知,已知,s75公斤,公斤,n=25例:某电池厂要检查某型号蓄电池的耐用性,随机例:某电池厂要检查某型号蓄电池的耐用性,随机抽取

    11、抽取100100只蓄电池进行检验,要求耐用时数极限只蓄电池进行检验,要求耐用时数极限误差不超过误差不超过2.62.6小时,试估计该厂蓄电池的耐用性小时,试估计该厂蓄电池的耐用性能。相应的数据资料如下表所示:能。相应的数据资料如下表所示:耐用时间耐用时间个数个数520-5304530-54018540-55024550-56028560-57016570-58010合计合计100耐用时数耐用时数个数个数f组中值组中值xxf520-53045252100-26.4696.962787.84530-540185359630-16.4268.964841.28540-5502454513080-6.4

    12、40.96983.04550-56028555155403.612.96362.88560-57016565904013.6184.962959.36570-58010575575023.6556.965569.6合计合计1005514017504fxx2)(xx2)(xx解:(1)计算样本平均数和标准差,并推算平均误差小时4.55110055140fxfx小时小时32.1102.132.1310017504)(2nSffxxSx (2)根据给定的极限误差,计算总体平均数的)根据给定的极限误差,计算总体平均数的 上下限。上下限。小时上限小时下限5546.24.5518.5486.24.551x

    13、xxx(3)根据97.132.16.2xxt%95)97.1()(FtF例:为了了解某市居民住户电视机普及率,随机抽取例:为了了解某市居民住户电视机普及率,随机抽取350户居民,其中户居民,其中280户居民有电视机。要求抽样户居民有电视机。要求抽样极限误差范围不超过极限误差范围不超过3.5%,试对该市居民住户电,试对该市居民住户电视机普及率进行估计。视机普及率进行估计。解:(1)抽取样本,计算样本成数、样本标准差及抽 样平均误差。%14.2350)8.01(8.0)1(%40)8.01(8.0)1(%803502801nppppSnnpp(2)根据给定的抽样误差范围,计算总体成根据给定的抽样误

    14、差范围,计算总体成 数的数的 上下限。上下限。%5.83%5.3%80%5.76%5.3%80pppp上限下限(3)根据64.1%14.2%5.3ppt查概率表得:%90)64.1(F 抽样数目的确定抽样数目的确定 抽样数目的大小是决定抽样误差大小的抽样数目的大小是决定抽样误差大小的直接因素。直接因素。确定抽样数目的原则:在保证预期的抽确定抽样数目的原则:在保证预期的抽样推断可靠程度的要求下,抽取的样本样推断可靠程度的要求下,抽取的样本单位数不宜过多。单位数不宜过多。决定抽样数目的因素决定抽样数目的因素1、总体被研究标志的变异程度2、允许误差的大小3、可靠程度的高低4、抽样方法与组织形式的不同

    15、5、人力、物力和财力的允许条件样本容量样本容量找出在规定误差找出在规定误差范围内的最小样范围内的最小样本容量本容量找出在限定费用找出在限定费用范围内的最大样范围内的最大样本容量本容量,xxttn22222xxtn21,xxnttnN22222222xxNtNnNtN 解解10000,25,5,2,xNt 己知克克则在重复抽样条件下则在重复抽样条件下 2222222251005xtn袋在不重复抽样的条件下在不重复抽样的条件下22222222221000022510000522599.01100 xNtnNt袋袋1,ppPPttn 22211PPt PPPPn11,ppPPnttnN 222211

    16、11ppNt PPNPPnNt PPNPP 例:对某型号电子元件例:对某型号电子元件10000只进行耐用性能检查,只进行耐用性能检查,根据以往抽样测定,求得耐用时数的标准差为根据以往抽样测定,求得耐用时数的标准差为600小时。小时。(1)在重复抽样条件下,概率保证程度为)在重复抽样条件下,概率保证程度为68.27%,元件平均耐用时数的误差范围不超过元件平均耐用时数的误差范围不超过150小时,要小时,要抽取多少元件作检查?抽取多少元件作检查?(2)根据以往抽样检查知道,元件合格率为)根据以往抽样检查知道,元件合格率为95%,合格率的标准差为合格率的标准差为21.8%。要求在。要求在99.73%的

    17、概的概率保证下,允许误差不超过率保证下,允许误差不超过4%,试确定重复抽样,试确定重复抽样所需抽取的元件数目是多少?所需抽取的元件数目是多少?161506001222222xtn26804.005.095.03)1(2222ppptn解:(1)根据已知得到:(2)根据已知得:解解25000,3,3,10.0651,ppNtPP 己 知2222130.06516510.03pt PPn件22222215000 30.0651150000.0330.0651pNt PPnNt PP 在重复抽样的条件下在重复抽样的条件下在不重复抽样的条件下在不重复抽样的条件下 576.004577件件【例例】某市开

    18、展职工家计调查,根据历史资料某市开展职工家计调查,根据历史资料该市职工家庭平均每人年收入的标准差为该市职工家庭平均每人年收入的标准差为24002400元,家庭消费总支出中食品消费支出元,家庭消费总支出中食品消费支出比重(恩格尔系数)为比重(恩格尔系数)为54%54%。现用重复抽样。现用重复抽样方法,要求在方法,要求在95.45%95.45%的概率保证下,平均的概率保证下,平均收入的抽样极限误差不超过收入的抽样极限误差不超过200200元,恩格尔元,恩格尔系数的抽样极限误差不超过系数的抽样极限误差不超过4%4%,请确定样,请确定样本必要数目。本必要数目。样本成数的样本必要数目:样本成数的样本必要

    19、数目:【解解】根据公式,在重复抽样条件下:根据公式,在重复抽样条件下:样本平均样本平均数的样本必要数目:数的样本必要数目:576(户)576(户)200200240024002 2t tn n2 22 22 22 22 22 26 62 21 1(户户)0 0.0 04 40 0.4 46 60 0.5 54 42 2p p)-p p(1 1t tn n2 22 22 22 2576(户)576(户)200200240024002 2t tn n2 22 22 22 22 22 2关于抽样单位数目的几点说明关于抽样单位数目的几点说明?在同样条件下,不重复抽样比重复在同样条件下,不重复抽样比重复

    20、抽样要求的抽样单位数目少。但不抽样要求的抽样单位数目少。但不重复抽样的抽样单位数目计算公式重复抽样的抽样单位数目计算公式比较复杂。在实际工作中,一般当比较复杂。在实际工作中,一般当 n/N n/N 的抽样比很小时(小于的抽样比很小时(小于5%5%),为了简化计算,虽然采用不重复,为了简化计算,虽然采用不重复抽样,也可用重复抽样计算公式计抽样,也可用重复抽样计算公式计算抽样单位数目。算抽样单位数目。关于抽样单位数目的几点说明关于抽样单位数目的几点说明n 同一总体往往同时需要估计总体同一总体往往同时需要估计总体平均数和总体成数,对二者可以平均数和总体成数,对二者可以分别计算出各自抽样单位数目,分别

    21、计算出各自抽样单位数目,为了防止抽样单位数目的不足,为了防止抽样单位数目的不足,在实际工作中,往往根据抽样单在实际工作中,往往根据抽样单位数目比较大的一个数目进行抽位数目比较大的一个数目进行抽样,以满足共同要求。样,以满足共同要求。22222xxtn22222222xxNtNnNZN 第三节第三节 抽样组织形式抽样组织形式n简单随机抽样简单随机抽样n类型抽样类型抽样n等距抽样等距抽样n整群抽样整群抽样n多阶段抽样多阶段抽样一、简单随机抽样一、简单随机抽样简单随机抽样简单随机抽样:又称为纯随机抽样,:又称为纯随机抽样,它是按照随机原则直接从总体它是按照随机原则直接从总体N N个个个个体中抽取体中

    22、抽取n n个个体作样本,使总体中个个体作样本,使总体中的每个个体都有同等的机会被抽中。的每个个体都有同等的机会被抽中。直接抽选法直接抽选法 抽签摸球法抽签摸球法 随机数表法随机数表法简单随简单随机抽样机抽样 l 直接抽选法直接抽选法是指直接从调查对象中随机抽是指直接从调查对象中随机抽选。例如,从仓库中存放的所有同类产品选。例如,从仓库中存放的所有同类产品中随机指定若干件产品进行质量检验;从中随机指定若干件产品进行质量检验;从粮食仓库中不同的地点取出若干粮食样本粮食仓库中不同的地点取出若干粮食样本进行含杂量、含水量的检验等。进行含杂量、含水量的检验等。l 抽签法抽签法即先将全及总体各个单位按照某

    23、种即先将全及总体各个单位按照某种自然的顺序编上号,并做成号签,再把号自然的顺序编上号,并做成号签,再把号签掺合起来,任意抽取所需单位数,然后签掺合起来,任意抽取所需单位数,然后按照抽中的号码取得对应的调查单位加以按照抽中的号码取得对应的调查单位加以登记调查。登记调查。l 随机数表随机数表是指含有一系列组别的随机数字是指含有一系列组别的随机数字的表格。的表格。随机数表:也称乱数表,是由随机生成的从随机数表:也称乱数表,是由随机生成的从0到到9十个十个数字所组成的数表,每个数字在表中出现的次数是大数字所组成的数表,每个数字在表中出现的次数是大致相同的,它们出现在表上的顺序是随机的致相同的,它们出现

    24、在表上的顺序是随机的.例如例如 某企业要调查消费者对某产品的需求量,要从某企业要调查消费者对某产品的需求量,要从95户居民家庭中抽选户居民家庭中抽选10户居民作为样本。具体步骤如下:户居民作为样本。具体步骤如下:第一步:将第一步:将95户居民家庭编号,每一户家庭一个编号,户居民家庭编号,每一户家庭一个编号,即即0195。(每户居民编号为。(每户居民编号为2数)数)第二步:在随机数表中,随机确定抽样的起点和抽样第二步:在随机数表中,随机确定抽样的起点和抽样的顺序。假定从第一行,第的顺序。假定从第一行,第9列开始抽,抽样顺序从左列开始抽,抽样顺序从左往右抽。(横的数列称往右抽。(横的数列称“行行”

    25、,纵的数列称为,纵的数列称为“列列”)第三步:依次抽出号码分别是:第三步:依次抽出号码分别是:36、61、46、98、63、71、62、33、26、16,共,共10个号个号码。由于码。由于98这个号码不在总体编号范围内,应这个号码不在总体编号范围内,应排除在外。再补充一个号码:排除在外。再补充一个号码:80。由此产生由此产生10个样本单位号码为:个样本单位号码为:36、61、46、80、63、71、62、33、26、16编号为这些号码的居民家庭就是抽样调查的对象。编号为这些号码的居民家庭就是抽样调查的对象。简单随机抽样的特点简单随机抽样的特点n 是抽样调查中最基本的组织形式;是抽样调查中最基本

    26、的组织形式;n 遵循随机原则直接从总体遵循随机原则直接从总体N N个单位中抽取个单位中抽取n n个单位作为样本;又称为纯随机抽样。个单位作为样本;又称为纯随机抽样。n 简单随机抽样被用作评估其他抽样策略简单随机抽样被用作评估其他抽样策略的效率的基准的效率的基准 ;n 简单随机抽样最原始的抽取方法是抽签简单随机抽样最原始的抽取方法是抽签法法,最常用的抽取方法是利用随机数最常用的抽取方法是利用随机数表表 。简单随机抽样适用的情况:简单随机抽样适用的情况:n对调查对象了解很少;对调查对象了解很少;n总体单位的排列没有秩序;总体单位的排列没有秩序;n均匀总体。均匀总体。注:注:前面所讨论的抽样平均误差

    27、的前面所讨论的抽样平均误差的计算公式就是简单随机抽样时计算公式就是简单随机抽样时的抽样平均误差的公式。的抽样平均误差的公式。二、类型抽样二、类型抽样类型抽样类型抽样:它是先对总体各单位按某种:它是先对总体各单位按某种标志分组,然后再从各组中按随机原标志分组,然后再从各组中按随机原则抽选一定单位构成样本,再对样本则抽选一定单位构成样本,再对样本总体进行观察。总体进行观察。特点特点:是统计分组和抽样法的结合。是统计分组和抽样法的结合。总体总体N样本样本n等额抽取等额抽取等比例抽取等比例抽取2NkN1N1n2nkn经过划类分组后,确定各类型组经过划类分组后,确定各类型组抽样单位数一般有两种方法:抽样

    28、单位数一般有两种方法:n 不等比例抽样不等比例抽样。即各类型组所抽选的。即各类型组所抽选的单位数,按各类型组标志值的变动程单位数,按各类型组标志值的变动程度来确定,变动程度大的多抽一些单度来确定,变动程度大的多抽一些单位,变动程度小的少抽一些单位,没位,变动程度小的少抽一些单位,没有统一的比例关系。有统一的比例关系。n 等比例抽样等比例抽样。即按照样本单位数在各。即按照样本单位数在各类之间分配的比重与总体在各类之间类之间分配的比重与总体在各类之间分配相同的比重进行抽样。分配相同的比重进行抽样。N=N1+N2+NKn=n1+n2+nKn 等比例抽样:等比例抽样:分类抽样总的抽样误差分类抽样总的抽

    29、样误差取决于各层内取决于各层内的抽样误差的抽样误差,而各层内的抽样误差又,而各层内的抽样误差又取决于各层内部的方差和抽样数目。取决于各层内部的方差和抽样数目。nnNNNnNniiii 不等比例抽样不等比例抽样根据各组中标志变异的大小根据各组中标志变异的大小确定适当的抽样数目,差异程度确定适当的抽样数目,差异程度大的组多抽一些单位,差异程度大的组多抽一些单位,差异程度小的组少抽一些单位。则小的组少抽一些单位。则NnNnii 重复抽样条件下重复抽样条件下 的计算公式的计算公式2xn22iinnnn)P1(PNN)P1(P)P1(P :n)P1(Piiiiiip 或或中中其等比例分层抽样的抽样平均误

    30、差等比例分层抽样的抽样平均误差其中:其中:22iin为总体方差为总体方差为第为第i组方差组方差为第为第i组样本容量组样本容量不重复抽样条件下不重复抽样条件下 的计算公式的计算公式2(1)xnnN )Nn1(n)P1(Pp 例:例:某乡全部粮食耕地某乡全部粮食耕地5000亩,按平原和亩,按平原和山区分类抽取山区分类抽取630亩,计算各组平均亩产亩,计算各组平均亩产和标准差和标准差 i 如下表。求抽样平均误差。如下表。求抽样平均误差。ix全部播全部播种面积种面积(亩)Ni(亩)Ni抽样面抽样面积(亩)积(亩)n ni i平原平原40004000504504960960200200山区山区10001

    31、000126126750750400400合计合计50005000630630918918253253)(xi斤斤)(i斤斤 解:解:2222 20050440012664000()630iinn斤264000630(1)(1)63050009.42()xnnN 斤三、等距抽样三、等距抽样(机械抽样、系统抽样机械抽样、系统抽样)等距抽样等距抽样:是先将总体单位按某一是先将总体单位按某一标志排队,计算出抽样间隔,标志排队,计算出抽样间隔,并在第一个抽样间隔内确定一并在第一个抽样间隔内确定一个抽样起点,再按固定的顺序个抽样起点,再按固定的顺序和相同的间隔来抽取样本单位和相同的间隔来抽取样本单位进行

    32、观察的一种抽样方法。进行观察的一种抽样方法。机械抽样按样本单位抽选的方法不同,机械抽样按样本单位抽选的方法不同,可分为三种:可分为三种:1.1.随随机起点等距抽样机起点等距抽样2.半距起点等距抽样3.对称等距抽样1.1.随随机起点等距抽样机起点等距抽样k k k k+a 2k+a (n-1)k+aak(k为抽取间隔)示意图:示意图:2.半距起点等距抽样k k kk(k为抽取间隔)2k2kk 22kk 2)1(kkn示意图:示意图:l 等距抽样的操作程序(以半距起点等距抽样为例)等距抽样的操作程序(以半距起点等距抽样为例)第一步:编制抽样框第一步:编制抽样框将全及总体按有关标志(将全及总体按有关

    33、标志(x)从低到高顺)从低到高顺序排队序排队 列出辅助标志(列出辅助标志(f)将辅助标志依次累计将辅助标志依次累计某村民小组有某村民小组有30户农户,若调查该村民小组户农户,若调查该村民小组所有农户所有农户2019年人均收入水平,可编制成如年人均收入水平,可编制成如下抽样框:下抽样框:序号序号12345678910111213141520192019年人均收入年人均收入(十元)(十元)x x185187190198201218256260274290295325340366368人口数(人)人口数(人)f f425343345421543人口数累计人口数累计461114182124283337

    34、3940454952抽中户抽中户序号序号16171819202122232425262728293020192019年人均收入年人均收入(十元)(十元)x x370371388402410446453470477490499502503516520人口数(人)人口数(人)f f423344243454335人口数累计人口数累计56586164687274788185909497100105抽中户抽中户抽样框第二步:第二步:计算抽样计算抽样距离(距离(K)如果抽取如果抽取6户进行调查,则:户进行调查,则:抽样距离抽样距离K=105617.5nfK需要抽取的单位数辅助标志累计数抽样距离第三步:抽取

    35、调查单位第三步:抽取调查单位l以半距起点、等距抽样为例以半距起点、等距抽样为例u 半距起点、等距抽样半距起点、等距抽样以第一个抽样距离的以第一个抽样距离的一半处一半处作为第一个调查作为第一个调查单位单位以后毎以后毎隔一个抽样距离隔一个抽样距离抽取一个调查单位抽取一个调查单位直到最后一个调查单位抽出为止直到最后一个调查单位抽出为止以抽取以抽取6户为例,抽取的户数依次为:户为例,抽取的户数依次为:l 第第1户户 n1=17.528.75 为第为第3号户号户l 第第2户户 n2=8.75+17.5=26.25 为第为第8号户号户l 第第3户户 n3=26.25+17.5=43.75 为第为第13号户

    36、号户l 第第4户户 n4=43.75+17.5=61.25 为第为第19号户号户l 第第5户户 n5=61.25+17.5=78.75 为第为第24号户号户l 第第6户户 n6=78.75+17.5=96.25 为第为第28号户号户抽中户的位置可用图形表示如下:抽中户的位置可用图形表示如下:n1n2n3n4n5n65k6k4k3k2k1k第四步第四步:对抽中单位进行代表性检查:对抽中单位进行代表性检查计算样本平均数与全及平均数之计算样本平均数与全及平均数之比值比值其比值以人均收入水平上下不超过其比值以人均收入水平上下不超过3%为有为有代表性。代表性。现以半距起点、等距抽取的现以半距起点、等距抽

    37、取的6户为例,检查其代表性户为例,检查其代表性l(全及)(全及)30户的人均收入户的人均收入xf/f=37990105 361.8(十元)(十元)l(样本)(样本)6户的人均收入户的人均收入x/n (190+260+340+402+477+503)6 362(十元)(十元)l二者比值为:二者比值为:362/361.8100.06l 可以看出,抽中的可以看出,抽中的6户有足够的代表性,可以作为样户有足够的代表性,可以作为样本进行调查。本进行调查。排列次序用的标志有两种:1.1.选选择标志与抽样调查所研究内容无关,择标志与抽样调查所研究内容无关,称无关标志排队。称无关标志排队。2.2.选选择标志与

    38、抽样调查所研究的内容有关,择标志与抽样调查所研究的内容有关,称有关标志排队。称有关标志排队。研究工人的平均收入水平时,按工号排队。研究工人的平均收入水平时,按工号排队。例例研究工人的生活水平,按工人月工资额高研究工人的生活水平,按工人月工资额高低排队。低排队。例例机械抽样机械抽样,实际上是一种特殊的类型抽样。因为,如果在类型抽样中,把总体划分为若干相等部分,每个部分只抽一个样本,在这种情况下,则类型抽样就成了机械抽样。机械抽样的优点:机械抽样的优点:l 能提高样本单位分布的均匀性,能提高样本单位分布的均匀性,样本代表性较强。其样本代表性较强。其 要小于要小于简单随机抽样时的简单随机抽样时的 。

    39、l 样本单位的抽取工作也比较容样本单位的抽取工作也比较容易开展。易开展。等距抽样的误差计算等距抽样的误差计算 直接计算等距抽样的平均误差比较困难,直接计算等距抽样的平均误差比较困难,通常是用简单随机抽样的误差公式来计通常是用简单随机抽样的误差公式来计算无关标志排队的等距抽样的平均误差;算无关标志排队的等距抽样的平均误差;用类型抽样的误差公式来计算有关标志用类型抽样的误差公式来计算有关标志排队的等距抽样的平均误差。排队的等距抽样的平均误差。4、整群抽样、整群抽样将总体单位划分成若干群(将总体单位划分成若干群(R)以群为单位,从中随机抽取一部分群(以群为单位,从中随机抽取一部分群(r)对中选群的所

    40、有单位进行全面调查。对中选群的所有单位进行全面调查。例如:对某镇农户进行家计调查,以自然村庄划例如:对某镇农户进行家计调查,以自然村庄划分群,抽取若干个自然村庄,对中选村庄的所有分群,抽取若干个自然村庄,对中选村庄的所有农户都进行调查。农户都进行调查。D村庄村庄L村庄M村庄N村庄村庄J村庄A村庄B村庄C村庄E村庄F村庄G村庄H村庄K村庄整群抽样的特点:整群抽样的特点:n 整群抽样直接抽取的不是总体中的个体而是整群抽样直接抽取的不是总体中的个体而是“群群”,因此总体和样本是由,因此总体和样本是由“群群”组成的组成的。n 总体中的每一群所包含的单位数有每一群的总体中的每一群所包含的单位数有每一群的

    41、单位数相等和不尽相等两种情况。单位数相等和不尽相等两种情况。n 影响抽样误差的方差是群间方差,群内方差影响抽样误差的方差是群间方差,群内方差不影响抽样误差。不影响抽样误差。n 整群抽样是不重复抽样,应该用不重复抽样整群抽样是不重复抽样,应该用不重复抽样公式计算抽样平均误差。公式计算抽样平均误差。整群抽样的优点:整群抽样的优点:u 由于是对中选群的全面调查,抽样单位比由于是对中选群的全面调查,抽样单位比较集中,所以整群抽样能大大降低数据收较集中,所以整群抽样能大大降低数据收集的费用;集的费用;v 当总体中个体自然聚合成群(例如:住户当总体中个体自然聚合成群(例如:住户、学校)时,整群抽样组织更加

    42、方便;、学校)时,整群抽样组织更加方便;w 如果对于调查变量而言,群内单元差异较如果对于调查变量而言,群内单元差异较大,而不同群的差异较小,整群抽样比简大,而不同群的差异较小,整群抽样比简单随机抽样的效率更高单随机抽样的效率更高(例如为估计性别例如为估计性别比采用按户的整群抽样比采用按户的整群抽样)。整群抽样的缺点:整群抽样的缺点:u 对调查变量,若群内个体有趋同性,则整对调查变量,若群内个体有趋同性,则整群抽样的抽样效率比简单随机抽样低,群抽样的抽样效率比简单随机抽样低,(这这正是通常遇到的情况正是通常遇到的情况),但对此项效率的损,但对此项效率的损失可通过增加群的抽取个数来弥补;失可通过增

    43、加群的抽取个数来弥补;v 通常无法提前控制总样本量,因为在进行通常无法提前控制总样本量,因为在进行调查前,我们通常不知道一个群内到底有调查前,我们通常不知道一个群内到底有多少个个体;多少个个体;w 抽样误差的计算可能比简单随机抽样更为抽样误差的计算可能比简单随机抽样更为复杂。复杂。整群抽样的整群抽样的 取决于取决于 2的大小的大小 整群抽样对中选群进行全面调查,其样本整群抽样对中选群进行全面调查,其样本代表性取决于抽中群体对全部群体的代表代表性取决于抽中群体对全部群体的代表性。假设各群体之间没有差异(即各群体性。假设各群体之间没有差异(即各群体的内部结构完全相同),则抽样误差为的内部结构完全相

    44、同),则抽样误差为0。可见,可见,整群抽样的整群抽样的 取决于群间差异程度的取决于群间差异程度的大小大小,而不受群体内部差异程度的影响。,而不受群体内部差异程度的影响。整群抽样的原则是:使群间方差尽可整群抽样的原则是:使群间方差尽可能小,群内方差尽可能大。能小,群内方差尽可能大。整群抽样的整群抽样的 计算:计算:总体未知时可用样本指标替代。总体未知时可用样本指标替代。)Rr1(r)1RrR(r2x2xx )Rr1(r)1RrR(r2p2pp R)XX(2i2x R)PP(2i2p 其中:其中:例:例:某市保险公司要调查居民家庭财产某市保险公司要调查居民家庭财产情况。该保险公司调查组把该市的街道

    45、情况。该保险公司调查组把该市的街道作为群,全市共作为群,全市共100个街道,共个街道,共100群。群。随机抽选了随机抽选了18个街道个街道(18群群)进行了调查。进行了调查。调查结果样本平均数(样本中居民平均调查结果样本平均数(样本中居民平均家庭财产数)为家庭财产数)为40000元,样本群间方元,样本群间方差为差为(5100元元)。试以。试以95.45%的置信的置信度估计全市平均家庭财产数。度估计全市平均家庭财产数。解:解:已知:已知:,R=100,r=18,t=2则:则:22x5100 )1094(71196868.68)110018100(185100)1RrR(r22xx元元 )(218

    46、810942txx元元 置信区间:置信区间:xxxXx 元元 即即42188 ,37812 218840000X218840000:五、多阶段抽样五、多阶段抽样(多级抽样多级抽样)多阶段抽样多阶段抽样:它是先从总体中抽:它是先从总体中抽取一级单位,再从一级单位中取一级单位,再从一级单位中抽取二级单位抽取二级单位如此下去,如此下去,最后才抽取所要调查的基本单最后才抽取所要调查的基本单位的一种抽样形式。位的一种抽样形式。优点优点:是比整群抽样灵活,在样本容:是比整群抽样灵活,在样本容量相同的条件下,多阶段抽样量相同的条件下,多阶段抽样的样本单位在总体中的散布比的样本单位在总体中的散布比整群抽样均匀

    47、。此外,它还可整群抽样均匀。此外,它还可以利用现成的行政区划组织系以利用现成的行政区划组织系统作为划分各阶段的依据。统作为划分各阶段的依据。缺点缺点:调查结果的精确性不太高,计:调查结果的精确性不太高,计算、分析比较复杂。算、分析比较复杂。以两阶段抽样为例以两阶段抽样为例两阶段抽样在组织技术上是整群抽两阶段抽样在组织技术上是整群抽样和类型抽样的综合。先将总体分为样和类型抽样的综合。先将总体分为R群,每群包含群,每群包含Mi个单位,假定个单位,假定N=M1+M2+M3+MR=RM,n1=m1+m2+m3+mro=r m。在每个阶段都是随机抽取样本,都会产在每个阶段都是随机抽取样本,都会产生随机误

    48、差,因此计算生随机误差,因此计算 时要综合两阶时要综合两阶段的误差。段的误差。多(二)阶段抽样的误差计算多(二)阶段抽样的误差计算 两阶段抽样在组织技术上是整群抽样和类两阶段抽样在组织技术上是整群抽样和类型抽样的综合。首先将总体划分为型抽样的综合。首先将总体划分为R组,组,每组包含每组包含Mi个单位。抽样第一阶段从个单位。抽样第一阶段从R组中随机抽取组中随机抽取r组,第二阶段再从中选的组,第二阶段再从中选的r组中分别从各组组中分别从各组Mi个单位中抽取个单位中抽取mi个单个单位,构成一个样本。这种抽样就是两阶位,构成一个样本。这种抽样就是两阶段抽样。其中:总体单位数段抽样。其中:总体单位数 N

    49、=M1+M2+M3+MR各组的单位数各组的单位数Mi可以是不等的,也可以是相等的。可以是不等的,也可以是相等的。为简化起见,假定总体为简化起见,假定总体R组中每组的单位数都组中每组的单位数都等于等于M,则有,则有N=RM。样本单位数样本单位数n=m1+m2+m3+mr各组抽各组抽取的单位数可以是不等的,也可以是相等的。取的单位数可以是不等的,也可以是相等的。为简化起见,假定各组抽取的单位数也相等,为简化起见,假定各组抽取的单位数也相等,则则n=rm两阶段抽样在组织技术上是整群抽样和类型抽样两阶段抽样在组织技术上是整群抽样和类型抽样的综合。的综合。样本平均数的计算过程如下:样本平均数的计算过程如

    50、下:1)计算第)计算第i组的样本平均数组的样本平均数1x=mijjxm2)计算样本的平均数)计算样本的平均数111 =rmrijiijixxxr mr两阶段抽样的平均误差是由两部分组成:两阶段抽样的平均误差是由两部分组成:第一部分是第一阶段从总体全部组抽取第一部分是第一阶段从总体全部组抽取部分组所引起的组间误差;第二部分是部分组所引起的组间误差;第二部分是由第二阶段在中选的组中抽取部分单位由第二阶段在中选的组中抽取部分单位所引起的组内平均误差,所以样本平均所引起的组内平均误差,所以样本平均数的抽样平均误差为数的抽样平均误差为22()()11xRrMmurRrm M例例 某车间有某车间有10个班

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:重点统计学课件之9-抽样推断-122页PPT.ppt
    链接地址:https://www.163wenku.com/p-3180434.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库