第4章-等概率整群抽样和多阶段抽样.课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第4章-等概率整群抽样和多阶段抽样.课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率 抽样 阶段 课件
- 资源描述:
-
1、第第4章章 等概率整群抽样和多阶等概率整群抽样和多阶段抽样段抽样n由若干有联系的基本单元所组成的集合称为群群。抽样时抽取群,并对入选群的所有基本单元进行调查,这种方法就是整群抽样整群抽样。n当群规模比较大时,由于群内单元通常具有相似性,对群内单元进行再抽样,这就是两阶段抽样两阶段抽样,其中的群也称为初级抽样单元初级抽样单元,群内再抽样的单元称为二级抽样单二级抽样单元元。4.1.1 定义定义2022-5-313l整群抽样(整群抽样(cluster samplingcluster sampling)是将总体)是将总体划分为若干群,然后划分为若干群,然后以群(以群(clustercluster)为抽
2、)为抽样单元样单元,从总体中随机抽取一部分群,对,从总体中随机抽取一部分群,对被选群内的被选群内的所有单元所有单元进行调查进行调查的一种抽样的一种抽样技术。技术。例例2022-5-314l欲估计某高校大学生拥有手机数量,大学共有欲估计某高校大学生拥有手机数量,大学共有4000040000名学生,名学生,1000010000个宿舍(每个宿舍个宿舍(每个宿舍4 4名学生)。名学生)。l方案方案1 1(简单随机抽样)(简单随机抽样):采用简单随机抽样方法抽采用简单随机抽样方法抽取取400400个学生;个学生;l方案方案2 2(整群抽样)(整群抽样):根据学生宿舍名录抽取根据学生宿舍名录抽取10010
3、0个宿个宿舍,并调查被抽宿舍的每一个学生;舍,并调查被抽宿舍的每一个学生;l方案方案3 3(两阶段抽样)(两阶段抽样):先随机抽取先随机抽取400400个宿舍,再在个宿舍,再在每个被抽中的宿舍中随机抽取每个被抽中的宿舍中随机抽取1 1个学生。个学生。4.1.2 整群抽样的特点整群抽样的特点(1)抽样框)抽样框编制得以简化(2)实施调查便利,节省费用节省费用 (3)对某些特殊结构的总体却有好的估计效果好的估计效果(4)抽样误差较大(可通过增大样本量的方法弥补抽样精度的损失)。大致可分为两类1.根据行政或地域形成的群体2.调查人员人为确定的分群的原则可用方差分析原理说明:4.1.3 群的划分群的划
4、分v群的规模大,估计的精度差但费用省;群的规模大,估计的精度差但费用省;v群的规模小,估计的精度可以提高但费用增群的规模小,估计的精度可以提高但费用增大;大;v群规模不宜过大群规模不宜过大v对于规模很大的群,通常需要采用多阶段抽样。对于规模很大的群,通常需要采用多阶段抽样。v有群规模相等与不相等两种情况有群规模相等与不相等两种情况4.1.4 群的规模群的规模4.1.5 符号说明符号说明表表 4.1 4.2 等概率整群抽样等概率整群抽样n4.2.1 群规模相等时的估计群规模相等时的估计群规模相同,均为群规模相同,均为M,则,则 的估计量为:的估计量为: Y1111nMnijiijiYyynMyn
5、11nMijijNyYNMynn定理定理 4.4.1 1: 是 的无偏估计,即n定理定理 4.24.2: 的方差为:yY YyEy221111()1NibiffVyYYSnNnMn定理定理 4.34.3: 的样本估计为:)(yV21)(bsnMfyv)()()()()(2222yvMNYvyVMNyNMVYVyNMY总体总值总体总值的估计量的估计量及其方差及其方差【例4.1】n在一次对某中学在校零花钱的调查中,在一次对某中学在校零花钱的调查中,以宿舍作为群进行整群抽样。每个宿舍以宿舍作为群进行整群抽样。每个宿舍都有都有M=6名学生。用简单随机抽样在全名学生。用简单随机抽样在全部部N=315间宿
6、舍中抽取间宿舍中抽取n=8个宿舍。全个宿舍。全部部48个学生上周每人的零花钱个学生上周每人的零花钱 及相关及相关计算数据如表计算数据如表4-2所示。试估计该学校学所示。试估计该学校学生平均每周的零花钱生平均每周的零花钱 ,并给出其,并给出其95%的置信区间。的置信区间。ijyY整群抽样的效率分析整群抽样的效率分析群内相关系数 表达式为:上式中的分子为:2)()(YYEYYYYEijikij2) 1()(MNMYYYYNMikij上式中的分母为:221)(SMNNMNMYYNMij故 又可写为:2) 1)(1()(2SMNMYYYYNMikij212222211( )( )11(1)11(1)1
7、11NiiYYfV yV yNMnMfNMSMnMNfSMnM 用简单随机抽样方法抽取n个群,每个群内的M个单元全部进入样本,则等群抽样均值估计量 的方差可用群内相关系数近似表示y22222) 1)(1() 1(2)(SNMMSNMYYYYYYYYYYNiMjkjikijijNiMjijNii n简单随机抽样的方差公式为n由此可计算出等群抽样的设计效应为21)(SnMfyVsrs) 1(1)()(MyVyVdeffsrs 整群抽样的估计效率,与群内相关系数 的关系密切。 当 时,deffM 当 时,deff1 当 为负时,deff1 的取值范围是1 0 1 ,11M群内方差为群内方差与总体方差
8、相等群间方差为群内相关系数也可由样本统计量 估计【例4.2】22,bwss2222) 1(wbwbsMsss221()1nbiiMsyyn22111()(1)nMwijiijsyyn M4.2.2 群规模不等时的估计群规模不等时的估计当群规模Mi不等时,有不同的抽取方法和估计方法。(1)等概抽样,无偏估计)等概抽样,无偏估计 思路:以群规模Mi为权数,乘以各群均值 ,得到群观察值总值yi,再将样本中n个群的群总和平均,求得群总和均值 ,再除以 群平均规模y1NiiMMNiy估计公式为:若 未知,可用样本群平均规模代替nMmni1101nniiiiiM yyyNYyynMnMMMNMM总体总值Y
9、的估计为总量估计的另一公式为0YM y1niiNYyn估计量的方差为它的无偏估计为均值估计 的方差为221()(1)( )1NiiYYNfV YnN221()(1)( )1niiyyNfv Ynny2212200()1(1)( )( )1NiiYYNfV yV YNMM n(2)等概抽样,比率估计)等概抽样,比率估计总体均值估计为这里辅助变量不是Xi而是群规模Mi总体总量估计为总体总量估计为11niiniiyyM1001niiniiyYM yMM估计量的方差分别是2221122()()11( )11NNiiiiiiYYMMYYffV yNNnMnM22222102221()(1)( )( )(
10、 )1()(1) 1NiiiNiiiYYMNfV YM V yN M V ynNMYYNfnN 与 的样本估计分别是2222122111()111( )(2)11niinnniiiiiiiiyM yffv yyyMyM ynnnMnM)(yV)(YV2222221111()(1)(1)1( )(2)11niinnniiiiiiiiyM yNfNfv YyyMyM ynnnn若若 未知,可用样本群平均规模未知,可用样本群平均规模 代替代替nMmniM 【例4.3】某县有33个乡,726个村,该年度某种作物总种植面积30525亩,现采用等概抽样随机抽出10个乡,要求估计全县总产量,计算抽样误差。
11、调查资料如下:样本乡编号村庄数 Mi作物总产量(乡) yi(万公斤)种植面积(乡) xi(亩)iiiMyy 123456789101518261420282119311722.022.830.221.725.331.226.020.533.823.68007801000700880110085080012008301.46671.26671.16151.551.2651.11431.23811.0791.09031.3882合计 209 257.1 8940 n分别采用几种方法估计(1)等概抽样,无偏估计)等概抽样,无偏估计1133(22.023.6)848.4310125.71niiniiN
展开阅读全文