第十章-其它抽样方法技术课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第十章-其它抽样方法技术课件.ppt》由用户(ziliao2023)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第十 其它 抽样 方法 技术 课件
- 资源描述:
-
1、 第十章第十章 其它抽样方法技术其它抽样方法技术本章要点本章要点 本章主要对样本轮换、双重抽样、随机化本章主要对样本轮换、双重抽样、随机化装置、交叉子样本等抽样技术原理、方法、装置、交叉子样本等抽样技术原理、方法、特点及应用条件进行了较为全面的介绍。具特点及应用条件进行了较为全面的介绍。具体要求体要求:掌握本章所介绍的几种抽样技术的特点及掌握本章所介绍的几种抽样技术的特点及应用条件,在抽样实际工作中能够正确运用应用条件,在抽样实际工作中能够正确运用该种技术,提高估计的精度与效果。该种技术,提高估计的精度与效果。第一节第一节 样本轮换样本轮换第二节第二节 双重抽样双重抽样第三节第三节 随机化装置
2、随机化装置 第四节第四节 交叉子样本交叉子样本 问题提出 时间序列数据以及随后出现的面板数据时间序列数据以及随后出现的面板数据都是经济统计分析和计量分析中非常重要的都是经济统计分析和计量分析中非常重要的数据类型。当我们在研究应该应用什么统计数据类型。当我们在研究应该应用什么统计和计量的方法去分析既定的时间序列数据时,和计量的方法去分析既定的时间序列数据时,是否考虑过以下几个问题?是否考虑过以下几个问题?n 时间序列数据是如何产生的?n 所产生的时间序列数据是否准确?n 如何让时间序列数据更加准确?随着社会经济现象的不断变化和发展,很多调随着社会经济现象的不断变化和发展,很多调查对象的总体也在不
3、断变化和发展。为了能够及时查对象的总体也在不断变化和发展。为了能够及时反映调查总体的这种变化和发展,调查部门就需要反映调查总体的这种变化和发展,调查部门就需要对同一总体在不同时间上进行连续性抽样调查对同一总体在不同时间上进行连续性抽样调查(Successive Sampling Survey),并定期公布调查结,并定期公布调查结果,形成一系列时序统计数据。因此,社会经济抽果,形成一系列时序统计数据。因此,社会经济抽样调查一般都应该是连续性的定期调查。样调查一般都应该是连续性的定期调查。n 一次性抽样调查与截面数据n 连续性抽样调查与时间序列数据及面板数据 抽样调查除了对总体的一次性抽样以外,很
4、多重要的抽样调查除了对总体的一次性抽样以外,很多重要的调查是隔一段时间重复进行的调查是隔一段时间重复进行的,对于这种经常性的抽样问对于这种经常性的抽样问题,就必须重视其样本轮换问题的研究。题,就必须重视其样本轮换问题的研究。对于样本轮换问题,我们至少应考虑以下问题:每次对于样本轮换问题,我们至少应考虑以下问题:每次调查的样本如何组成?是采用固定样本还是采用全新的调查的样本如何组成?是采用固定样本还是采用全新的样本,或者是部分保留部分替换,即样本轮换;在估计样本,或者是部分保留部分替换,即样本轮换;在估计后期的总量或均值时,是否需要利用前期的信息来改进后期的总量或均值时,是否需要利用前期的信息来
5、改进现期的估计,以及如何利用;如果采用样本轮换的方法,现期的估计,以及如何利用;如果采用样本轮换的方法,如何确定最优的保留比例或替换比例。如何确定最优的保留比例或替换比例。第一节第一节 样本轮换样本轮换 连续性抽样设计方法按抽取样本的不同划分轮换样本轮换样本重复样本重复样本固定样本固定样本单水平轮换单水平轮换不完全的单水平轮换不完全的单水平轮换多水平轮换多水平轮换 轮换模式应用举例n加拿大劳动力调查(加拿大劳动力调查(LFS)使用)使用60单水平轮单水平轮换模式换模式n美国现时人口调查(美国现时人口调查(CPS)使用)使用484不完全不完全单水平轮换模式单水平轮换模式n美国消费者支出的季度调查
6、(美国消费者支出的季度调查(CEQ)便采用)便采用40三水平轮换模式三水平轮换模式 中国城市住户抽样调查中国城市住户抽样调查n中国规模以下工业企业抽样调查中国规模以下工业企业抽样调查n中国农产量抽样调查中国农产量抽样调查一、样本轮换的原因一、样本轮换的原因 如果是单纯地估计现值的情况,当然最好每次重新抽取新如果是单纯地估计现值的情况,当然最好每次重新抽取新样本,这样必然会增加费用;如果要逐期地与上期比较,则采样本,这样必然会增加费用;如果要逐期地与上期比较,则采用固定样本的方法为好,固定样本可以消除样本的因素而只观用固定样本的方法为好,固定样本可以消除样本的因素而只观察动态的变化。然而,样本长
7、期不变,随着时间的推移,固定察动态的变化。然而,样本长期不变,随着时间的推移,固定样本会显露它的弊端,既难以反映总体的变化,而且受访者也样本会显露它的弊端,既难以反映总体的变化,而且受访者也会产生厌烦心理,出现不合作或回答质量下降等问题,从而影会产生厌烦心理,出现不合作或回答质量下降等问题,从而影响调查质响调查质量。另外,无论是采用固定样本还是全新样本都难以量。另外,无论是采用固定样本还是全新样本都难以正确地反映总体在各个不同时间上的水平及变化,因此,一种正确地反映总体在各个不同时间上的水平及变化,因此,一种广泛采用的方法是样本轮换,即每隔一定时间(一个月、一季广泛采用的方法是样本轮换,即每隔
8、一定时间(一个月、一季或一年)更换一定比例的单元,保留其余单元。或一年)更换一定比例的单元,保留其余单元。第一节第一节 样本轮换样本轮换 与传统的一次性抽样调查相比,轮换的与传统的一次性抽样调查相比,轮换的抽样调查具有以下特有的优势:抽样调查具有以下特有的优势:n 节省调查费用和调查资源节省调查费用和调查资源n 在一定程度上减轻被调查者回答负担在一定程度上减轻被调查者回答负担n 利用前后各期之间的相关关系提高估计精度利用前后各期之间的相关关系提高估计精度n我国我国1996年新修订的年新修订的统计法统计法第十条明确规定:第十条明确规定:“统计调查应当以周期性普查为基础,以统计调查应当以周期性普查
9、为基础,以经常性抽经常性抽样调查样调查为主体,以必要的统计报表、重点调查、综为主体,以必要的统计报表、重点调查、综合分析等为补充,搜集、整理基本统计资料。合分析等为补充,搜集、整理基本统计资料。”n因此,在今后我国政府统计部门开展的统计调查制因此,在今后我国政府统计部门开展的统计调查制度与方法改革的过程中,最重要的就是围绕如何更度与方法改革的过程中,最重要的就是围绕如何更好地好地发挥经常性抽样调查的主体作用发挥经常性抽样调查的主体作用,研究并应用,研究并应用更加符合我国国情的经常性抽样调查方法,以此得更加符合我国国情的经常性抽样调查方法,以此得出更加准确的统计数据,为我国政府部门、研究机出更加
10、准确的统计数据,为我国政府部门、研究机构以及各类企事业单位等社会各界服务。构以及各类企事业单位等社会各界服务。我国抽样调查制度与方法改革的方向二、样本轮换的最优比例二、样本轮换的最优比例第一个时期采用有放回简单随机抽样方式抽出样本量为第一个时期采用有放回简单随机抽样方式抽出样本量为n n的样本;在第二个时期采用有放回简单随机抽样方式选的样本;在第二个时期采用有放回简单随机抽样方式选出样本量为出样本量为nqnq的旧有样本点以便替换掉,即保留的样本的旧有样本点以便替换掉,即保留的样本量为量为npnp,保留样本的比例为,保留样本的比例为p p,同时独立地依有放回简单,同时独立地依有放回简单随机样本方
11、式补充新的随机样本方式补充新的nqnq个新样本点,这里个新样本点,这里p+qp+q=1=1,这样,这样第二个时期的样本量仍旧为第二个时期的样本量仍旧为n n。设。设:第一节第一节 样本轮换样本轮换 为第一个时期与第二个时期相同的为第一个时期与第二个时期相同的npnp个单元在第一个时期个单元在第一个时期的均值。的均值。为第一个时期为第一个时期nq个单元在第一个时期的均值。个单元在第一个时期的均值。为为np个单元在第二个时期的样本均值。个单元在第二个时期的样本均值。为为nq个补充单元在第二个时期的样本均值。个补充单元在第二个时期的样本均值。为为 和和 之间的相关系数。之间的相关系数。如果希望估计第
12、二个时期的样本均值并充分利用第一个时如果希望估计第二个时期的样本均值并充分利用第一个时期的信息,令该估计量为期的信息,令该估计量为 ,那么它应该是充分利用前后期,那么它应该是充分利用前后期中保留样本、不保留样本和后期新补充样本的加权平均数。中保留样本、不保留样本和后期新补充样本的加权平均数。第一节第一节 样本轮换样本轮换 xxxxyyxxywy 设我们希望得到的估计量设我们希望得到的估计量 是两期估计量的线性函数,即是两期估计量的线性函数,即 =a +b +c +d (10.1)要求估计其参数要求估计其参数a,b,c,d。因为因为E()=E()=,E()=E()=,所所以以E()=(a+b)+
13、(c+d)。要使。要使 成为成为 的无偏估计的无偏估计量,需量,需a+b=0,c+d=1,也即,也即b=-a,d=1-c。代入(。代入(10.1),有),有 =a=a(-)+c +c +(1-c1-c)第一节第一节 样本轮换样本轮换 xyyxxywywyxywywyXXYYYwyxxyy第一节第一节 样本轮换样本轮换 xxx该估计量的方差可以求得为:该估计量的方差可以求得为:2222221 1(1)2()().yyx yxwccacV yaq p np nqnpn 其中其中 是第一个时期的方差,是第一个时期的方差,是第二个时期的方差。我是第二个时期的方差。我们要求出们要求出a a和和c c,使
14、得,使得 达到最小,就要以上公式分别对达到最小,就要以上公式分别对a a和和c c求偏微分并使之等于求偏微分并使之等于0 0,即可求出,即可求出a a和和c c的最优值分别为:的最优值分别为:2x2y()wV y第一节第一节 样本轮换样本轮换 该估计量的方差可以求得为:该估计量的方差可以求得为:22.1yxpqaq221pcq第一节第一节 样本轮换样本轮换 xxx将其代入公式(将其代入公式(10.110.1),就得到),就得到 2222222(1)()111ywxpqpqqyxxyyqqq该估计量的方差为该估计量的方差为 :22221()1ywqV ynq第一节第一节 样本轮换样本轮换 如果不
15、利用前期信息,只根据第二期的结果来估如果不利用前期信息,只根据第二期的结果来估计均值,那么计均值,那么 :其方差为其方差为 :ypyqy2()yVyn第一节第一节 样本轮换样本轮换 xxx故利用前期信息后的设计效果为故利用前期信息后的设计效果为 :从上式可以看出,当从上式可以看出,当的值比较大时,利用上期信息的值比较大时,利用上期信息可以较大地提高可以较大地提高 的效率。表的效率。表10.110.1给出了不同的给出了不同的q q,值值时时 的值。的值。222()1()1wVyqVyqwy()()wV yV y第一节第一节 样本轮换样本轮换 xxx 表表10.1 10.1 不同的不同的q q,值
16、时值时 的值的值 ()()wV yV y 若对上式关于若对上式关于q求偏导,并使之等于求偏导,并使之等于0,那么便可得,那么便可得到最优轮换比:到最优轮换比:2211q第一节第一节 样本轮换样本轮换 xxx三、样本轮换方法三、样本轮换方法 (一)(一)随机轮换法随机轮换法 在进行轮换时按确定的轮换单位数目或比例,从原有样本在进行轮换时按确定的轮换单位数目或比例,从原有样本中随机抽出若干单位不再调查,而从其余未包括在样本中的总中随机抽出若干单位不再调查,而从其余未包括在样本中的总体单位中抽取同样数目的单位来代替。体单位中抽取同样数目的单位来代替。第一节第一节 样本轮换样本轮换 xxx (二)(二
17、)等距轮换法等距轮换法 在总体抽样框中确定出各个等距抽样的样本,在各次的调在总体抽样框中确定出各个等距抽样的样本,在各次的调查中,按相应位置的等距样本单位进行轮换。我国农村住户调查中,按相应位置的等距样本单位进行轮换。我国农村住户调查就是采用这种轮换方式。查就是采用这种轮换方式。(三)(三)子样本轮换法子样本轮换法 从总体中抽出若干套子样本,每次调查一定数量的子样本,从总体中抽出若干套子样本,每次调查一定数量的子样本,逐次轮换其中的部分子样本。逐次轮换其中的部分子样本。第一节第一节 样本轮换样本轮换 xxx 子样本轮换实际上就是每次采用交叉子样本,而交叉子子样本轮换实际上就是每次采用交叉子样本
18、,而交叉子样本不仅能有效地减少和控制估计偏差,而且由于每个交叉样本不仅能有效地减少和控制估计偏差,而且由于每个交叉子样本都能代表总体,即使有的子样本资料搜集不到,我们子样本都能代表总体,即使有的子样本资料搜集不到,我们也可以用其他的子样本甚至一个子样本来观察和推断总体。也可以用其他的子样本甚至一个子样本来观察和推断总体。此外,用交叉子样本还可以考察非抽样误差发生的程度。因此外,用交叉子样本还可以考察非抽样误差发生的程度。因此,一般来说,子样本轮换方法是以上三种样本轮换方法中此,一般来说,子样本轮换方法是以上三种样本轮换方法中最好的。最好的。第一节第一节 样本轮换样本轮换 xxx五、案例介绍五、
19、案例介绍 美国人口现状调查(美国人口现状调查(current population surveycurrent population survey,CPSCPS)是国际上最著名的抽样调查项目之一,已经成为美国以及许多是国际上最著名的抽样调查项目之一,已经成为美国以及许多国家进行居民调查的参考模型,其实施是在每个月包含国家进行居民调查的参考模型,其实施是在每个月包含1919号的号的那一周进行,调查的问题涉及受访者此前一周内的活动。调查那一周进行,调查的问题涉及受访者此前一周内的活动。调查氛围覆盖全美氛围覆盖全美5050个州和哥伦比亚地区。个州和哥伦比亚地区。CPSCPS采用的就是样本轮换采用的就
20、是样本轮换的方法,即每位受访者连续的方法,即每位受访者连续4 4个月接受访问,然后退出样本,个月接受访问,然后退出样本,8 8个月后再进入样本,连续个月后再进入样本,连续4 4个月接受访问,最后永久地退出样本个月接受访问,最后永久地退出样本。第一节第一节 样本轮换样本轮换 xxxCPS 在在1995年年7月的抽样设计方案中样本轮换的特征:月的抽样设计方案中样本轮换的特征:1 在任意一个月内,都有在任意一个月内,都有1/8 的住户单元第一次接受调查,的住户单元第一次接受调查,1/8的住户单元第二次接受调查,依次类推。的住户单元第二次接受调查,依次类推。2每个月都由新的样本组代替从样本中永久退出的
21、老样本每个月都由新的样本组代替从样本中永久退出的老样本组。组。3 每个月都有一个样本组在闲置每个月都有一个样本组在闲置8个月后重新接受调查,以个月后重新接受调查,以此代替刚刚进入闲置期的样本组。此代替刚刚进入闲置期的样本组。4通过轮换设计,保证每个样本单元在通过轮换设计,保证每个样本单元在2个年份的个年份的4个相同个相同 月份里接受调查。月份里接受调查。5.5.在连续的在连续的2个月内,有个月内,有3/4/的样本点是相同的;在连续的的样本点是相同的;在连续的2年内,有年内,有1/2的样本点是相同的。的样本点是相同的。二维平衡单水平轮换模式的轮换过程 2148 二维平衡单水平轮换模式的轮换过程
22、2148第二节第二节 双重抽样双重抽样 xxx 我们可以先从总体中抽取一个大的初始样本,从我们可以先从总体中抽取一个大的初始样本,从而获得总体的辅助信息,然后再从初始样本或从总体而获得总体的辅助信息,然后再从初始样本或从总体中再抽一个子样本,这种方法就是中再抽一个子样本,这种方法就是双重抽样双重抽样。第二节第二节 双重抽样双重抽样 xxx一、定义一、定义 双重抽样,也称二相抽样或二重抽样双重抽样,也称二相抽样或二重抽样(two-phase(two-phase sampling)sampling),是指在抽样时分两步抽取样本。一般情况下,先从,是指在抽样时分两步抽取样本。一般情况下,先从总体总体
23、N N中抽取一个较大的样本,称为第一重中抽取一个较大的样本,称为第一重(相相)样本样本(the first(the first phase sample)phase sample),对之进行调查以获取总体的某些辅助信息,为,对之进行调查以获取总体的某些辅助信息,为下一步的抽样估计提供条件;然后进行第二重抽样下一步的抽样估计提供条件;然后进行第二重抽样(the second(the second phase sampling)phase sampling)。第二重抽样所抽的样本。第二重抽样所抽的样本n n相对较小,但是第相对较小,但是第二重抽样调查才是主调查。二重抽样调查才是主调查。第二节第二节
24、 双重抽样双重抽样 xxx 二、双重抽样与两阶段抽样的区别二、双重抽样与两阶段抽样的区别(一)两阶段抽样(一)两阶段抽样(two-stage samplingtwo-stage sampling)是先从总体)是先从总体N N个单个单元元(初级单元初级单元)中抽出中抽出n n个样本单元,却并不对这个样本单元,却并不对这n n个样本单元中个样本单元中的所有小单元的所有小单元(二级单元二级单元)都进行调查,而是在其中再抽出若干都进行调查,而是在其中再抽出若干个二级单元进行调查;双重抽样则不同,要对第一重个二级单元进行调查;双重抽样则不同,要对第一重(相相)样本样本进行调查以获取总体的某些辅助信息,并
25、且要利用这些辅助信进行调查以获取总体的某些辅助信息,并且要利用这些辅助信息进行排序、分层、抽样或估计等。息进行排序、分层、抽样或估计等。第二节第二节 双重抽样双重抽样 xxx(二)两阶段抽样的第二阶段抽样单元和第一阶段抽(二)两阶段抽样的第二阶段抽样单元和第一阶段抽样单元往往是不同的;双重抽样要有一份最终单元的样单元往往是不同的;双重抽样要有一份最终单元的完整名册完整名册(总体所有单元的抽样框总体所有单元的抽样框),而两阶段抽样只,而两阶段抽样只是需要第一阶段单元是需要第一阶段单元(初级单元初级单元)名册,然后在中选的名册,然后在中选的初级单元中构造第二阶段抽样的抽样框初级单元中构造第二阶段抽
展开阅读全文