系统抽样-课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《系统抽样-课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 系统抽样 课件
- 资源描述:
-
1、第八章 系统抽样n第一节 概述n第二节 等概率系统抽样估计量n第三节 不同特征总体的系统抽样n第四节 系统抽样的方差估计1ppt课件第一节 概述n一、系统抽样的定义n二、系统抽样的实施方法n三、排序标志n四、系统抽样的特点n五、系统抽样、整群抽样与分层抽样的关系2ppt课件一、系统抽样的定义n系统抽样(Systematic sampling):也称机械抽样,它是将总体中的单元按某种顺序排列,在规定的范围内随机抽取起始单元,然后按一套规则确定其它样本单元的一种抽样方法。n上述定义是广义的,事实上,总体单元的排列可以是一维的(直线或圆形的),也可以是二维的(平面的);起始单元可以是一个,也可以是一
2、组;对总体单元的抽取可以是等概的也可以是不等概的。3ppt课件n系统抽样中最简单的是等间隔抽取,这种系统抽样又称为等距抽样等距抽样。n等距抽样的随机性是有限制的,因此也被称为伪随机抽样,但要注意:等距抽样并未真正丧失随机性原则。n例:工业产品质量检查,每隔2小时抽选一个或若干样品进行检验。4ppt课件二、系统抽样的实施方法n(一)直线等距抽样n假设:总体N个单元按直线排列,样本容量为n,且有N/n=k,k为整数,称为抽样间距整数,称为抽样间距(sampling interval)。n实施方法:n1.将总体分为n段,每段k个单元n2.在第一段的k个单元中随机抽取一个单元rn3.每隔k个单元抽出一
3、个单元,共抽取n个单元,则被抽中的单元编号分别为:r,r+k,r+2k,r+(n-1)kn例见课本P1425ppt课件n方法评价:n当N/n=k为整数时,总体中每个单元的入样概率都相等(都等于1/k),从而是一种严格的等概率抽样。n当N/n=k不是整数时,实际抽取到的样本单元数可能是N/k,也可能是N/k+1,也即与原来设定的样本量可能相差1。每个单元的入样概率也是不相等的。这时等距抽样有可能产生偏倚。6ppt课件n(二)循环等距抽样n为克服直线等距抽样的上述缺陷,拉希里(Lahiri)提出一种替代方法,称为循环(或圆形)等距抽样。n实施方法:n1.将总体排成首尾相连的圆形。n2.在1N范围内
4、随机抽取整数r作为起始单元编号。n3.每隔间距k(k为最接近N/n的整数)抽取样本单元。直到抽足n个单元为止。n评价:对于循环等距抽样,即使对于N/n不为整数的情况,不仅样本量不会随起始值而变化,且是严格等概率的。n例:见P1437ppt课件n注意注意:以下为了处理方便,我们假定N总是n的整数倍。在实际工作中,若n充分大,则由于N/n非整数而带来的影响就充分小,可以忽略不计。8ppt课件n(三)不等概系统抽样法n常用的不等概率系统抽样是PS系统抽样n令:表示总体所有单元大小的总和,n则有入样概率为:n在实际中,实施不等概率抽样最简单的方法是代码法。NiiMM100MMnii9ppt课件n实施方
5、法:n1.先将单元 Mi值累加,取最接近M0/n 的整数k为抽样间距。n2.从 1,k中随机抽取一个整数作为起始单元编号。n3.每间隔k抽取样本单元,则代码 r,r+k,r+(n-1)k 所对应的单元即样本单元.10ppt课件n【例【例7.17.1】设总体由】设总体由1010个行政村组成个行政村组成,N=10,N=10,每个行政村的人每个行政村的人数数 M Mi i见下表见下表,利用利用PS 系统抽样抽取系统抽样抽取 n=3 n=3 个行政村个行政村行政村编号行政村编号人数人数(Mi)累计人数累计人数抽中代码抽中代码110310310024325353966314246877723584961
6、6731034720512398168140713469146155310317187011ppt课件解:623,3,1870010nMknMMNii在 1,623中随机抽取整数r,设r=100,则 r+k=723,r+2k=1346,则对应的行政村为1,4,8.注:对于特别大的单元一般直接作为样本,然后对剩余的单元组成的总体实施抽样.12ppt课件三、排序标志n等距抽样需要有作为排序依据的辅助标志。n排序标志各式各样,可自由选择,但归纳起来,可分为两类,即无关标志和有关标志,它们对等距抽样的作用和相应的估计精度各有不同的影响。13ppt课件(一)按无关标志排队(无序系统抽样)n即各单元的排列
7、顺序与所研究的内容无关.n如研究人口的收入状况时,按身份证号码、按门牌号码排序非常方便,一般说来,这些号码与调查项目没有关系,因此可以认为总体单元的次序排列是随机的n无关标志排序的等距抽样也称无序等距抽样。14ppt课件n评价:n在无关标志排序的条件下,各单元的位次排定,并不等于各单元的调查标志值也按同一次序排定,虽然是等距抽样,它与随机抽样在性质上并无不同.n故无关标志排序的等距抽样,实质上相同于简单随机抽样,二者只是抽样形式不同而已,完全无损于随机原则,它们在估计精度上也是一致的。15ppt课件(二)按有关标志排序 n即各单元的排列顺序与所研究的内容是有关的,用来对总体单元规定排列次序的辅
8、助标志,与调查标志具有共同性质或密切关系。n这种排序标志,在我国抽样调查实践中有广泛应用,如农产量调查,以本年平均亩产为调查变量,以往年已知平均亩产作为排序标志。n利用这些辅助标志排序,有利于提高等距抽样的抽样效果。16ppt课件(三)根据各单元原有的自然位置进行排序n例如:学生按学号抽样,入户调查根据街道门牌号按一定间隔抽取等。n这种自然状态的排列有时与调查标志有一定的联系,但又不完完一致,这主要是为了抽样方便。17ppt课件四、系统抽样的特点n优点:n1.简便易行,容易确定样本单元n等距抽样简单明了,快速经济,操作灵活方便,使用面广,是单阶段抽样中变化最多的一种抽样技术。n在某些场合下甚至
9、可以不用抽样框。例如若要对公路旁的树木进行病虫害调查,确定每20棵数检查一棵,只要在初始被检树确定后,每隔20棵检查一棵即行,根本不需要在事先对公路旁的所有树木进行编号,或者不需要知道抽样框即所有树木的棵数。n在我国,等距抽样已成了最主要、最基本的抽样方式,一些大规模的抽样调查,如农产量抽样调查、城乡住户调查、人口抽样调查、产品质量抽样检查中都普遍采用了等距抽样。18ppt课件n2.样本单元在总体中分布比较均匀样本单元在总体中分布比较均匀,有有 利于提利于提高估计精度高估计精度.n将总体各单元按一定的顺序排列后再抽样,使得样本单元的分布更加均匀,因而样本也就更具代表性,比简单随机抽样更精确。1
10、9ppt课件n缺点:n1.如果单元 的排列存在周期性的变化,而抽样者对此缺乏了解或缺乏处理的经验,抽取出样本的代表性就可能很差可能很高。这时要慎重地选择K。n如:调查某航空公司每月班机旅客人数(淡季、旺如:调查某航空公司每月班机旅客人数(淡季、旺季)季)k=12n2.系统抽样的方差估计较复杂,一般系统抽样没有设计意义下的无偏估计量,并且在很多实际应用中所采用的系统抽样都不是严格的概率抽样,这就给系统抽样方差的估计带来很大的困难.20ppt课件五、系统抽样、整群抽样和分层系统抽样、整群抽样和分层抽样的关系抽样的关系n系统抽样可以看成是一种特殊的整群抽样,也可以看成是一种分层抽样。n为了看清其中的
11、关系,我们以一般的等距抽样为例,将总体中的N(=nk)个单元按k个一组排成表,共有k行n列。n等距抽样,即将总体个单元排列成k行n 列的矩阵,在从k之间随机地产生一个随机数r,则取第r行的全体单元作为样本21ppt课件 系统抽样的总体单元系统抽样的总体单元12jn平均1Y1Yk+1Y(j-1)k+1 Y(n-1)k+12Y2Yk+2Y(j-1)k+2 Y(n-1)k+2rYrYk+rY(j-1)k+rY(n-1)k+rkYkY2kYjkYnk1y2yryky22ppt课件n如果将表的行看作群,实际上相当于将总体划分为 k群,系统抽样相当于从这 k个群中随机地抽出一个大小为n的群实行整群抽样,这
12、是最简单的整群抽样.n因此,在讨论传统抽样的参数估计时,很多场合将引用整群抽样的一些现成结果.系统抽样与整群抽样参数的对照23ppt课件n如果将表的列看作层,那么系统抽样又是一种分层抽样:在每层中抽取一个单元,不过这个单元在每个层中的位置是相同的,因此不是分层随机抽样.24ppt课件 系统抽样的总体单元按行列重新编号12jn群平均1Y11Y12Y1jY1n2Y21Y22Y2jY2n:rYr1Yr2YrjYrn:KYk1Yk2YkjYkn层平均1Y2YjYnyYkYrY2Y1Y25ppt课件第二节第二节 等概率系统抽样估计量等概率系统抽样估计量n一、符号说明n二、估计量n三、估计量方差的不同表示
13、形式26ppt课件一、符号说明 第r行第j列的单元指标值:Yrj Yrj=Y(j-1)k+r ,r=1,2,k;j=1,2,n 总体单元数:N 样本单元数:n 系统样本平均数:系统样本均值估计量:njrjryny11syy27ppt课件 层均值:,j=1,2,n 总体方差:系统样本(群)内方差:jy2S2112)()1(1krnjrrjwsyyynkS2)()(YyEYyYyErjrurjwsy样本(群)内相关系数:层内方差:211.2)()1(1njkrjrjwstyyknS同一系统样本内对层均值离差的相关系数:2.)()(jrjurujrjwstyyEyyyyE28ppt课件二、估计量设起
14、始值为r,则相应系统样本的平均数为:总体均值 的估计量为:njrjnjrjrYnyny1111Ynjrjrsyynyy1129ppt课件性质性质1 当当 N=nk 时时,有有 k 个可能样本个可能样本:是无偏估计量是无偏估计量.当当 ,采用直线等距方法时采用直线等距方法时,是有偏的是有偏的.但但 N和和n均比较大时均比较大时,其偏倚不会很其偏倚不会很大大,可以忽略不计可以忽略不计.若采用循环等距抽样若采用循环等距抽样,是无偏的是无偏的.syyYynkykyEkrnjrjkrrsy11111)(nkN syysyy30ppt课件三、估计量方差的不同表示形式三、估计量方差的不同表示形式n如前所述,
15、如果总体单元是按无关标志排列的,则其方差可按简单随机抽样去做。n若总体单元是按有关标志排列的,则此时的等距抽样可以看作是整群抽样或分层抽样的特例,因此,等距抽样估计量的方差可以比照整群抽样或分层抽样的方法构造,有几种表示方法。31ppt课件krrsysyYykYyEyV122)(1)()(为方便起见,假定 N=nk,因此系统样本的平均数 是总体均值的无偏估计,它的方差按定义为:syy32ppt课件性质性质2 用样本用样本(群群)内方差内方差 表示系统抽表示系统抽样估计量的方差样估计量的方差:2wsyS22)1()1()(wsysySNnkSNNyV2112)(11krnjrjYyNS式中:为总
16、体方差。2112)()1(1krnjrrjwsyyynkS为系统样本(群)内方差33ppt课件Ysrsy221)(SnfSNnnNyVsrs如果从总体中直接抽取样本量为n的简单随机样本,则总体均值 的估计量 的方差为:)(1)()(22SSnnyVyVwsysysrs比较等距抽样方差和简单随机抽样方差:34ppt课件抽样法抽样效果相同系统抽样法与简单随机等于总体方差时,时,即等距样本内方差当抽样法;简单随机抽样优于系统总体方差时,即等距样本内方差小于当机抽样;系统抽样法优于简单随总体方差时,即等距样本内方差大于当222222,SSSSSSwsywsywsy可见:35ppt课件性质3系统抽样可看
17、做一种特殊的整群抽样,系统抽样估计量的方差可以用群内相关系数 表示:wsysynNNnSyV)1(1)1()(2)()()1)(1(2)()(122YyYySNnYyEYyYyErukrnujrjrjrurjwsywsy式中:可见:系统样本(群)内正相关正相关越大,也即系统样本内单元越相似,差别越小,则估计量的方差越大,这个结论与上面结论一致。36ppt课件性质4系统抽样可看做一种特殊的分层抽样,系统抽样的估计量的方差可以用层内方差 和同一等距样本内单元对层均值的相关系数 表示:wstSwstwstsynNnNnSyV)1(1)()(2wst式中:211.2)()1(1njkrjrjwstyy
18、knS为层内方差)(2NnNnSwst恰为比例分配分层随机抽样的方差kiijjyky1.1为第j层的平均值37ppt课件2.)()(jrjurujrjwstyyEyyyyE为同一系统样本内对层均值离差的相关系数.)()()1)(1(2.1.2urukrnujjrjwstyyyySknn38ppt课件比较系统抽样方差 和比例分配的分层随机抽样方差 ,)(syyV)(styVwststsywststnyVyVNnNnSyV)1(1)()()()(2于分层随机抽样。时,系统抽样的精度高当同;单位的分层随机抽样相各层随机抽取一个时,系统抽样的精度与于分层随机抽样;时,系统抽样的精度低当000wstws
19、twst可见:39ppt课件【例【例7.27.2】n设某个总体N=32个单元,总体单元排列显然有稳定上升的趋势.我们要产生一个样本量为4的等距样本,将总体单元排列如下表,k=8,n=4,每一列都是一个等距样本,共8个等距样本.40ppt课件n N=32,k=8,n=4等距样本数据层 等距样本编号层均值123456781113345673.7527881112 14 16 1611.5317 18202024 24 25 27 21.875427 28303134 34 36 3832.25总数52 55616574 77 83 88_显然,层内具有正相关,由性质4可知,系统抽样的精度低于分层随
20、机抽样。41ppt课件n层内方差与总方差分别为:5.11)()1(1211.2njkrjrjwstyyknS523.129)(111122krnjrjYyNS42ppt课件452.9)(1)()(122krrsysyYykYyEyV516.23243245.11)()(2NnNnSyVwstst333.2845232.12932432)(2SNnnNyVsrs因此:本例中,分层随机抽样和等距抽样比简单随机抽样更有效,而分层随机抽样比等距抽样更有效。实际上,将总体单元按大小顺序排列的目的就是为了增大系统样本内方差,从而必然提高精度。43ppt课件【例【例7.37.3】n利用例7.2的数据,但将第
21、二层和第四层的观测值次序颠倒,数据如下:层 等距样本编号层均值123456781113345673.75216 1614121188711.5317 18202024 24 25 27 21.875438 36343431 30 28 2732.25总数72 71716970 67 67 68_44ppt课件202.0)(1)()(122krrsysyYykYyEyV此时,等距抽样均值估计的方差为:516.23243245.11)()(2NnNnSyVwstst333.2845232.12932432)(2SNnnNyVsrs而分层随机抽样和简单随机抽样均值估计的方差不变:可见:本例中,改变数
22、据顺序后,等距抽样比简单随机抽样和分层随机抽样更有效。45ppt课件n上述例子说明:n相对于分层随机抽样和简单随机抽样来说,系统抽样的效率很大程度上取决于总体性质。n即使是相同的总体数据,对于不同的单元排列顺序,就有不同的样本(群)内方差和相关系数,从面系统抽样估计量的方差也不同。n因此,要有效地应用系统抽样,必须先了解总体的特征。46ppt课件第三节第三节 不同特征总体的系统抽样不同特征总体的系统抽样一一.随机次序排列的总体随机次序排列的总体总体单元按无关标志排列,如居民家计调总体单元按无关标志排列,如居民家计调查按居民姓氏次序排列的总体单位。查按居民姓氏次序排列的总体单位。47ppt课件n
展开阅读全文