抽样调查课件第八章-调查中的复杂样本.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《抽样调查课件第八章-调查中的复杂样本.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样调查 课件 第八 调查 中的 复杂 样本
- 资源描述:
-
1、第一节 概述一 、 什 么 是 复 杂 样 本二 、 基 本 思 路1.“ 复 制 ”2“ 迭 代 ”三 特 点不 是 百 分 之 百 准 确 , 但 简 化 了 复 杂 过 程 重抽样(复制样本),泰勒级数,广义方差函数l典型抽样方法?l复杂设计:多种抽样方法结合,多种抽样框l复杂估计:非线性,无回答调整,加权估计,事后分层第二节 随机组法一. 什么是随机组法(Random Group Method) 不同的名称: replicate samples 重复样本 ultimate cluster 末级群 交叉样本 等 不同的术语来自于不同的应用。 设 nyyy,.,21为 来 自 同 一 总
2、体 的 变 量 值 , 则 Y的 方 差 可 用 2)(11yynni估 计 , 记 1 为 的 一 个 估 计 量 , 同 样 方 法 重 复 K次 , 则 可 得 到 k,.,21 记作2)() 1(1)(1kikikkk它是参数 的无偏估计,称估计量).2 , 1(kii为随机组。随机组产生的二种方式:独立和不独立)(V二、独立随机组独立随机组的操作程序:1多次重复2与抽样方式无关,但每个样本抽样方式一致。得到 K 个关于的估计,记为 ),.2, 1(kaakka )(E)()() 1()()(2VEkkka无偏估计 的置信区间为 )(2/ Z 以比率估计为例 XY aaaXY kz/)
3、(2),(2NkaakXYk1 11/kaaakaaaYkYXkX全样本估计对 线 性 估 计 量 , 与 相 同对 非 线 性 估 计 量 ,与 通 常 不 同) 1()()(21kkka) 1()()(22kkka保守估计)()(EE)()(EE因为: 222)()()(Kaa 故有)()(21 研究表明,在复杂调查应用中,)(2E是 微不足道的。 例题: 住户调查,多阶段分层抽样。 抽取样本 S1,放回后再按照同样方式抽取 S2 调查得到1与2 2)(21 22)() 12(21)(a=4)(221 1S2S1y1x2y2x样本样本拒答户数合格调查户数拒答户数合格调查户数城区141150
4、371492401493014833814538150总计119444105447251. 08912242121XXYYR251. 0)235. 0268. 0(21)(2121RRR000274. 0)() 1(1)(211RRkkRvk000274. 0)() 1(1)(212RRkkRvk案例:美国 AAA Motel 的调查 调查内容:意向调查 抽样框:文档卡片 调查设计主要特征: 调查结果:见表一、表二 有放回 表一 各类别回答结果 随机组 经常 很少 没有 无明确回答 未回答 合计 1 16 40 17 2 19 94 2 20 30 17 3 15 85 3 18 35 16
5、1 15 85 4 17 31 14 2 16 80 5 14 32 15 3 18 82 6 15 32 12 4 16 79 7 19 30 17 3 17 86 8 13 37 11 3 18 82 9 19 39 19 2 14 93 10 17 39 15 2 15 88 合计 168 345 153 25 163 854 表二 对无回答子样本访问的结果 随机组 经常 很少 没有 暂时关闭 合计 1 1 2 2 1 6 2 1 2 1 1 5 3 2 2 0 1 5 4 2 1 2 0 5 5 1 3 1 2 7 6 2 2 0 1 5 7 1 3 1 1 6 8 1 2 1 2 6
6、 9 2 2 1 0 5 10 1 2 0 2 5 合计 14 21 9 11 55 问题1:合同汽车旅馆的估计值及方差? 问题2: 回答为“经常”的合同汽车旅馆的数量及方差? 问题3:估计回答“很少”与“没有”的比例及其方差? 总数 11111370nriiriiYYY= 70(16+31) = 1330 权数:入样概率倒数 17211170iiXX = 7094= 6580 597810/101XX12653)9(101)(1012XXXv第一随机组中回答者和无回答者子样本的求和 789. 0161032201300161032201R没有很少经常没有很少737. 010/101RR000
7、1139. 0)9(101)(10121RRRv737. 012602856147012602856R0001139. 0)9(101)(10122RRRv三、非独立随机组 将母样本随机划分为 K 组: m=n/K 从 n-m 中再抽取 m 作为第二组 若 n/k 不是整数,便有 n=km+q q 的处理 关键是划分 K 组的过程: 实际应用中很难实现多次有放回抽样,而是把一次样本随机分为k个随机组,所以随机组相互不独立末级群估计: kka )(V的估计量为 2)() 1(1)(kakk 对 于的 方 差 估 计 有 两 种 方 式 :)()(122)() 1(1)(kakk因 为,)()(2
8、2aa 故 )(2v 保 守 估 计 量由 于 随 机 组 非 独 立 , 故 )(不 是 方 差 的 无 偏 估 计 。) 1(,2)() 1(1)()(12kkCovkkVEbkakabaka 式中 aaE Ekka 若kmmm.21 则,a这时 ,)()(21CovVE 在许多大规模调查中偏差通常都不会很大随机组问题的讨论涉及两个主要问题: 1. 估计量 的方差 2.估计量方差 的精度,即对随机组方差估计 的质量评估。 )(V)(v四、K的选择 )(v也是一个估计量,对其质量进行评估自然想到其方差)(vV,从而引出CV准则)()()(21VVCV定理: 设k,.,21为独立同分布的随机变
9、量, 而)(如公式 ) 1()()(2kkka所定义,则 当N,n很大,抽样比很小时,也可用于不独立随机组211413)()(kkkVCV 其中 2214114)()()(EE )(1E (1)峰度由(1)式看出, 近似地反比于随机组个数K2CVkvCV1)()(142定理说明CV依赖于两个因素, 和K 1. K小,CV则大 2. 大,CV也大)(14)(14)(4a说明,方差的随机组估计的精度,不但依赖 k,而且与 的a分布(从而与 )有关。令m=n/k,如取采用有放回简单随机抽样,取 为a组的样本均值,则 anikaynk11这时2244414/)(/ /)(/ ) 1(3)(NYYNYY
10、mmmNiNi式中若抽样方式为放回PPS抽样,取 为第a组的总体总和的估计量,则 imiazym/12244414/)(/)(/ ) 1(3/11NiNinikaNTTNTTmmmynk式中)(这时上述两种形式蕴含了这样一个事实,从本质上讲, 的形式。bma具有)(14m从1开始增长时,峰度明显减少,但随m越来越大,峰度的递减作用减少,因此对越来越大的m,峰度的边际递减不足以弥补必要的k的递减,K对减少CV和提高方差估计精度比组容量m更重要。C为计算方差预算,21CC、为加法或乘法单位成本,使 )(CV在下列费用约束下达到最小 CCkCkm21) 32(1) 3( )(CV是K的递减函数,最优
11、值为满足约束方程中最大的K值。 要满足需要的精度水平 *CV*)(CVvCV需要什么样的m和k? 估计 听取专家意见根据经验判断)(14K增长时费用会增加,因此最优k的选择应该在费用约束下寻找LhhhyW1LhhhdW12241styvsty)(stRGyv212,)() 12( 21ststyy22 ,1 ,)(41ststyyL2LhhhhhhyyW12211)(,sty1h121hh)(21212,stststLyVyyELLhhhhdW1)(21ststyy,11121)(或hhststLyyL21,21stLLLhhhhyyyW)2/2( )(11212,ststyyLhhhdW12
展开阅读全文