书签 分享 收藏 举报 版权申诉 / 84
上传文档赚钱

类型企业抽样调查知识与实例分析(-84张)课件.ppt

  • 上传人(卖家):晟晟文业
  • 文档编号:3998269
  • 上传时间:2022-11-02
  • 格式:PPT
  • 页数:84
  • 大小:368.50KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《企业抽样调查知识与实例分析(-84张)课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    企业 抽样调查 知识 实例 分析 84 课件
    资源描述:

    1、来自来自 中国最大的资料库下载中国最大的资料库下载 1企业抽样调查2主要内容u抽样调查基本知识u服务业抽样调查概况u企业抽样调查实例来自来自 中国最大的资料库下载中国最大的资料库下载 3抽样调查基本知识4主要内容v抽样调查的基本概念抽样调查的基本概念v抽样调查的基本理论抽样调查的基本理论v基本抽样方法基本抽样方法v抽样方法的选择抽样方法的选择v对抽样调查的基本认识对抽样调查的基本认识5一、抽样调查的基本概念一、抽样调查的基本概念 v抽样调查抽样调查v概率抽样与非概率抽样概率抽样与非概率抽样v总体与样本总体与样本 v目标总体与抽样总体目标总体与抽样总体 v抽样框抽样框 v调查单位与抽样单位调查单

    2、位与抽样单位 v误差误差 v误差限与置信度误差限与置信度 v抽样效率与设计效果抽样效率与设计效果 6抽样调查抽样调查v统计调查分为全面调查与非全面调查两类。抽样调统计调查分为全面调查与非全面调查两类。抽样调查是非全面调查中的一种重要方法,它是从所研究查是非全面调查中的一种重要方法,它是从所研究对象的全体(总体)中抽取一部分(样本)进行调对象的全体(总体)中抽取一部分(样本)进行调查,获取数据,并以此对总体目标量作出推断(估查,获取数据,并以此对总体目标量作出推断(估计)。这是广义的抽样调查概念。计)。这是广义的抽样调查概念。根据样本抽取方法的不同,抽样可分为概率抽样和根据样本抽取方法的不同,抽

    3、样可分为概率抽样和非概率抽样。非概率抽样。7概率抽样概率抽样v概率抽样(概率抽样(probability samplingprobability sampling)也称随机抽样。)也称随机抽样。概率抽样是严格地按照给定的概率来抽取样本的。概率抽样是严格地按照给定的概率来抽取样本的。特点:特点:按一定的概率以随机原则抽取样本。随机不等与随便。按一定的概率以随机原则抽取样本。随机不等与随便。随机有严格的科学定义,可用概率来描述,而随机有严格的科学定义,可用概率来描述,而 随便带有人为或主观因素,它不是一个科学的概念。随便带有人为或主观因素,它不是一个科学的概念。8概率抽样概率抽样(续续)每个单位被

    4、抽中的概率是已知的,或可计算每个单位被抽中的概率是已知的,或可计算出来。出来。当用样本对总体目标量估计时,要考虑到该当用样本对总体目标量估计时,要考虑到该样本抽中的概率,也就是说,估计量不仅与样本抽中的概率,也就是说,估计量不仅与样本观测值有关样本观测值有关,也与被抽中的概率有关。也与被抽中的概率有关。n通常所提到的抽样调查实际上指的就是概率通常所提到的抽样调查实际上指的就是概率抽样。抽样。n国际交流:企业抽样调查包括本行业所有规国际交流:企业抽样调查包括本行业所有规模的企业。模的企业。9非概率抽样非概率抽样v非概率抽样(非概率抽样(non-probability samplingnon-pr

    5、obability sampling)是相对)是相对于概率抽样而言,并无严格的定义,不是按随机原于概率抽样而言,并无严格的定义,不是按随机原则来抽选的。这种抽样效果的好坏在很大程度上依则来抽选的。这种抽样效果的好坏在很大程度上依赖于抽样者的主观判断能力和经验,而且不能计算赖于抽样者的主观判断能力和经验,而且不能计算抽样误差,不能从概率意义上控制误差并以此来保抽样误差,不能从概率意义上控制误差并以此来保证推断的准确性。此外,即使经验可能已表明某种证推断的准确性。此外,即使经验可能已表明某种非概率方法过去曾有较好效果,但这并不能保证该非概率方法过去曾有较好效果,但这并不能保证该方法一直如此。不过尽

    6、管有其理论上的弱点,各种方法一直如此。不过尽管有其理论上的弱点,各种形式的非概率抽样仍在实践中广泛采用,主要原因形式的非概率抽样仍在实践中广泛采用,主要原因是节省费用和方便。是节省费用和方便。10非概率抽样非概率抽样(续(续1)v通常我国的典型调查和重点调查通常我国的典型调查和重点调查,西方国家称为的西方国家称为的有目的抽样或判断抽样等都属于非概率抽样。有目的抽样或判断抽样等都属于非概率抽样。v如果调查的目的是用样本数据推断总体的目标量,如果调查的目的是用样本数据推断总体的目标量,并以一定的把握程度保证总体目标量落在目的范围,并以一定的把握程度保证总体目标量落在目的范围,这时非概率抽样是不合适

    7、的。这时非概率抽样是不合适的。11总体和样本总体和样本v总体(总体(populationpopulation):总体就是全部被研究的单):总体就是全部被研究的单位位,也称研究总体。按研究的总体不同,总体单位也称研究总体。按研究的总体不同,总体单位可以是人、户或企业。在服务业抽样调查中,总可以是人、户或企业。在服务业抽样调查中,总体就是这些行业的企业和个体户。体就是这些行业的企业和个体户。v样本样本(sample)(sample):是总体的一部分,从总体中按一:是总体的一部分,从总体中按一定程序抽得的那部分个体或抽样单位。样本量定程序抽得的那部分个体或抽样单位。样本量n n对对总体总单位数总体总

    8、单位数N N的比称为抽样比的比称为抽样比(sampling(sampling fraction)fraction):Nnf 12目标总体与抽样总体目标总体与抽样总体v目标总体(目标总体(target populationtarget population):是真正作为研究对):是真正作为研究对象的全体。如要研究山西省居民服务业的情况,目标总象的全体。如要研究山西省居民服务业的情况,目标总体就是所有从事居民服务业的企业和个体户。体就是所有从事居民服务业的企业和个体户。v抽样总体(抽样总体(sampling populationsampling population):是用作抽样的总):是用作抽样

    9、的总体,也就是抽样框。体,也就是抽样框。v二者应一致,实际难做到。如目标总体是二者应一致,实际难做到。如目标总体是20062006年所有从年所有从事居民服务业的企业和个体户,但很难做到对在调查时事居民服务业的企业和个体户,但很难做到对在调查时(20072007年年1 1月)已消亡的单位的调查,尽管在调查时消月)已消亡的单位的调查,尽管在调查时消亡,但可能在亡,但可能在20062006年全年营业。年全年营业。v先定义目标总体,再根据条件进行修订得到抽样总体。先定义目标总体,再根据条件进行修订得到抽样总体。13总体参数与样本统计量总体参数与样本统计量v无论对总体还是样本,统计中通常使用平均数和标无

    10、论对总体还是样本,统计中通常使用平均数和标准差等这样一些数量关系进行描述,它们被用于描准差等这样一些数量关系进行描述,它们被用于描述总体特征时,称为述总体特征时,称为总体参数总体参数,用于描述样本特征,用于描述样本特征时,称为时,称为样本统计量样本统计量。如:居民服务业抽取。如:居民服务业抽取800800家家企业,调查结果计算出企业平均营业收入企业,调查结果计算出企业平均营业收入400400万元万元(样本统计量),总体平均营业收入(总体参数)(样本统计量),总体平均营业收入(总体参数)未知。未知。v抽样目的是样本(样本统计量)推断总体(总体参抽样目的是样本(样本统计量)推断总体(总体参数)。如

    11、用数)。如用800800家的平均营业收入作为总体平均营家的平均营业收入作为总体平均营业收入的估计值。业收入的估计值。14抽样框抽样框 v抽样框抽样框(sampling frame)(sampling frame):抽样框是指包含:抽样框是指包含所有抽样单位的名单或名册。由于抽样方法所有抽样单位的名单或名册。由于抽样方法不同不同,可有目录框和区域框可有目录框和区域框,分级抽样框。分级抽样框。名单中的每个单位都有可识别的基本信息;名单中的每个单位都有可识别的基本信息;名单的范围应是完整的,不重不漏。现实中使用的名单的范围应是完整的,不重不漏。现实中使用的抽样框并不十分完备,一方面,要改进和完善,如

    12、抽样框并不十分完备,一方面,要改进和完善,如更新和维护;另一方面调查的设计者要认真分析抽更新和维护;另一方面调查的设计者要认真分析抽样框的状况,以评价框的不完整对调查结果产生的样框的状况,以评价框的不完整对调查结果产生的影响,并尽可能采取一些补救的办法。影响,并尽可能采取一些补救的办法。15调查单位与抽样单位调查单位与抽样单位v调查单位(调查单位(survey unitsurvey unit):抽样调查要通过):抽样调查要通过对样本单位的观察或调查来取得有关数据或对样本单位的观察或调查来取得有关数据或记录有关特征,这些单位称为调查单位。如记录有关特征,这些单位称为调查单位。如企业和个体户。企业

    13、和个体户。v抽样单位抽样单位(sampling unit)(sampling unit):抽样单位是指将:抽样单位是指将总体划分成不重叠的有限多个部分的每个部总体划分成不重叠的有限多个部分的每个部分。区域、企业和个体户。分。区域、企业和个体户。16误差误差 v抽样误差(抽样误差(sampling errorsampling error):是由于用样):是由于用样本估计总体而产生的误差,也叫代表性误差。本估计总体而产生的误差,也叫代表性误差。v非抽样误差(非抽样误差(nonsampling errornonsampling error):是指):是指除抽样误差以外的,由于各种原因而引起的除抽样误

    14、差以外的,由于各种原因而引起的误差,在各种方式的调查中都存在。误差,在各种方式的调查中都存在。17抽样框误差v遗漏单位与新增单位;遗漏单位与新增单位;v重复;重复;v辅助信息是否准确。辅助信息是否准确。18无回答误差v单位无回答;单位无回答;v项目无回答;项目无回答;v部分无回答。部分无回答。19设计误差v问卷设计引起的误差;问卷设计引起的误差;v抽样设计抽样设计(选用的方法、分层合理性选用的方法、分层合理性)及抽选及抽选过程过程(随机随机)引起的误差。引起的误差。20调查员引起的误差v调查员的责任心和态度;调查员的责任心和态度;v调查员水平。调查员水平。21被调查者引起的误差v无意识回答误差

    15、;无意识回答误差;v有意识回答误差。有意识回答误差。22处理误差v编码;编码;v编辑录入;编辑录入;v加权;加权;v做表。做表。23点估计和区间估计点估计和区间估计v点估计:抽样调查用样本统计量直接作为总体参数点估计:抽样调查用样本统计量直接作为总体参数的估计值,称点估计。如用样本计算得到的企业平的估计值,称点估计。如用样本计算得到的企业平均营业收入作为总体企业的平均营业收入的估计值,均营业收入作为总体企业的平均营业收入的估计值,就是点估计。就是点估计。v区间估计:是对总体参数可能落入的一个数值范围区间估计:是对总体参数可能落入的一个数值范围作出的估计,估计值的取值范围称作出的估计,估计值的取

    16、值范围称“置信区间置信区间”,与置信区间估计相联系的概率称与置信区间估计相联系的概率称“置信度置信度”,表示,表示置信区间估计包含了总体参数的可靠程度有多大。置信区间估计包含了总体参数的可靠程度有多大。24抽样效率与设计效果抽样效率与设计效果v抽样效率(抽样效率(sampling efficiencysampling efficiency):是指两):是指两个抽样方案的抽样方差之比;当某个估计量个抽样方案的抽样方差之比;当某个估计量的方差比另一估计量的方差小时,则称方差的方差比另一估计量的方差小时,则称方差小的估计量效率比较高。小的估计量效率比较高。v设计效果设计效果(design effec

    17、t,(design effect,,简写为,简写为Deff)Deff):就是把一个设计方案的方差与简单随机抽样就是把一个设计方案的方差与简单随机抽样的方差进行比较。的方差进行比较。DeffDeff小于小于1 1时,表示设计方时,表示设计方案的效率高于简单随机抽样,反之,效率低案的效率高于简单随机抽样,反之,效率低于简单随机抽样。于简单随机抽样。25三种性质的分布三种性质的分布v总体分布(总体分布(population distributionpopulation distribution):是指研):是指研究对象这一总体的各个单位标志值的分布状况。究对象这一总体的各个单位标志值的分布状况。v样

    18、本分布(样本分布(sample distributionsample distribution):样本单位标):样本单位标志值的的分布,就称为样本分布志值的的分布,就称为样本分布 。随着样本的增。随着样本的增多,样本分布逐渐接近总体分布。多,样本分布逐渐接近总体分布。v抽样分布:是指样本估计量的分布。如采用同样的抽样分布:是指样本估计量的分布。如采用同样的抽样方法和同等的样本量,在居民服务业企业中抽抽样方法和同等的样本量,在居民服务业企业中抽取多套样本,每套样本都能计算出一个估计量,所取多套样本,每套样本都能计算出一个估计量,所有可能的估计量形成的分布就是抽样分布。有可能的估计量形成的分布就是

    19、抽样分布。26永久随机数永久随机数v随机数就是按随机方法而生成的数码。即随机数就是按随机方法而生成的数码。即0 0,1 1,2929这十个数字出现的机会是等概率的,但排列这十个数字出现的机会是等概率的,但排列的顺序是随机的。永久随机数(的顺序是随机的。永久随机数(Permanent Random Permanent Random NumbersNumbers)则是指长久使用、不改变的随机数。比)则是指长久使用、不改变的随机数。比如一个企业一旦被赋予了一个随机数,则在以后的如一个企业一旦被赋予了一个随机数,则在以后的调查中都使用这个随机数,它类似企业法人代码,调查中都使用这个随机数,它类似企业法

    20、人代码,具有唯一和终身性。具有唯一和终身性。v对于样本轮换和不同调查中共享样本非常有用。对于样本轮换和不同调查中共享样本非常有用。v首先对每个单位赋予一个随机数,然后按随机数大首先对每个单位赋予一个随机数,然后按随机数大小顺序排队,抽取所需要的样本量。小顺序排队,抽取所需要的样本量。27概率概率v概率是指用来测定样本被抽中可能性大小的一个非负的数值。28权数权数v在概率抽样中,每个样本单位都代表调查总体中的一些未被抽中单位,通常,将一个样本单位所代表的总体单位的数量即样本单位抽中概率的倒数称为这个样本单位的设计权数或基础权数。29权数权数(续(续1 1)100个企业中抽10个企业,每个企业被抽

    21、中的概率就是10/100=1/10,权数就是100/10=10,即一个样本企业代表了总体中的10个企业。分层抽样中,要在层内计算权数。如企业分成大、中、小3层。30分层抽样基础权数计算方法企业按规模分层总体中企业单位数样本 企业个数抽中概率基础 权数大型200200 200/200=11中型3000300300/3000=1/1010小型7000350350/7000=1/2020合计10200850850/10200=1/121231权数权数(续(续2 2)v最终权数与基础权数之间的关系最终权数等于基础权数:如果一项抽样调查不存在无回答或涵盖不全等情况,基础权数等于最终权数,可以直接用于估计

    22、。最终权数在基础权数基础上进行调整:存在无回答情况(无回答多与少);范围涵盖不全;企业分开;企业重复。32权数权数(续(续3 3)n不同的抽样方法,权数是不一样的,即推算方法是不一样的。v目录抽样:基础权数=N/n,最终权数在基础权数基础上进行调整(无回答、范围涵盖不全)。v二阶段目录抽样:基础权数等于两个阶段权数之积。最终权数在基础权数基础上进行调整(无回答、范围涵盖不全),在两个阶段分别调整。如服务业个体抽样,第一阶段抽居村委会,基础权数等于层内居村委会个数样本居村委会个数;33权数权数(续(续4 4)第二阶段抽部分个体户,基础权数等于样本居村委会中个体户总数抽取的个体户数。为了避免权数调

    23、整,调查中可规定:PSU和个体户不允许无回答;合并和分开的PSU,维持原状;对样本PSUs维护个体户数。fgtybn37.xls34权数权数(续(续5 5)v整群抽样:与目录抽样方法类似,只不过是将一个群当作一个样本单位对待。基础权数=N/n,最终权数在基础权数基础上进行调整(无回答、范围涵盖不全)。为了避免权数调整,调查中可规定:PSU和个体户不允许无回答;合并和分开的PSU,维持原状;对样本PSUs维护个体户数。35总量估计方法v各种抽样方法都有自己的总量估计计算方法,一些复杂抽样的总量估计计算公式比较复杂,但利用权数,各种抽样方法总量估计计算公式可统一、简单地表述为样本权数与指标值乘积的

    24、关系。v 为回答单位的最终权数,是样本单位的指标值。iiywY*iwiy36二、抽样调查的基本理论二、抽样调查的基本理论v两个极限定理两个极限定理v估计量的优良性估计量的优良性 n不用怀疑n要遵守抽样原则37两个极限定理两个极限定理 v大数定理:随机事件的规律总是在对大量随机现象的观察中才能显现出来,随着观察次数的增大,随机影响将相互抵消,而使规律性有稳定的性质。v中心极限定理:由于正态分布在数理统计中具有特别重要的地位,因此关于寻找在什么条件下将趋于正态分布,这类定理统称为中心极限定理。38估计量的优良性估计量的优良性v无偏性:,的平均值(期望值),满足这个关系的 称为是无偏的。v相合性:当

    25、 时,以 为极限,满足这个性质的估计量称为是相合的。v有效性(方差小):方差小的估计量比方差大的估计量有效。v可用性:若 趋于零的速度比均方误差的平方根趋于零的速度更快,则称 是可用的。Enn B39三、基本抽样方法三、基本抽样方法 v 简单随机抽样(简单随机抽样(simple random samplingsimple random sampling)v等距(系统)抽样等距(系统)抽样(systematic sampling)(systematic sampling)v分层抽样分层抽样(stratified sampling)(stratified sampling)v二阶与多阶抽样二阶与多

    26、阶抽样(twostage or multistage(twostage or multistage samplingsamplingv整群抽样(整群抽样(cluster samplingcluster sampling))v不等概率抽样(不等概率抽样(sampling with unequal sampling with unequal probabilitiesprobabilities)v二重抽样(二重抽样(double samplingdouble sampling)或双相抽样)或双相抽样(two(two phase sampling)phase sampling)40简单随机抽样简单随

    27、机抽样v方法方法:1到到N编号,抽取编号,抽取n个,个,每一个样本都有同样的每一个样本都有同样的机会被抽中。机会被抽中。v条件:必须有包含全部单位的抽样框。条件:必须有包含全部单位的抽样框。v优点:简单方便,不需要辅助信息。优点:简单方便,不需要辅助信息。v缺点:若样本分散,不好组织或调查成本高;缺点:若样本分散,不好组织或调查成本高;N大大时抽样框不容易编制时抽样框不容易编制 。v企业调查中,通常有某些用于分层的辅助信息,很企业调查中,通常有某些用于分层的辅助信息,很少直接采用简单随机抽样,通常只是用于其他方法少直接采用简单随机抽样,通常只是用于其他方法的某些过程,如分层抽样中层内样本的抽取

    28、。的某些过程,如分层抽样中层内样本的抽取。41等距(系统)抽样等距(系统)抽样v方法方法:先将总体单位按某种顺序排队,随机确定一先将总体单位按某种顺序排队,随机确定一个起点抽取第一个样本单位,然后每隔个起点抽取第一个样本单位,然后每隔 (=N/n)个单位个单位抽取其余单位。如果抽样间距不是整数,抽取其余单位。如果抽样间距不是整数,可四舍五入。可四舍五入。v条件:总体单位的一个确定的排列条件:总体单位的一个确定的排列 。v优点:实施简单优点:实施简单 。v缺点:缺点:精度估计比较困难精度估计比较困难。通常采用简单随机抽。通常采用简单随机抽样的方差公式替代。如企业调查中按某规模大小样的方差公式替代

    29、。如企业调查中按某规模大小排队,有利于提高精度,在某种程度上获得比例排队,有利于提高精度,在某种程度上获得比例分层的效益,但此时采用简单随机抽样的方差公分层的效益,但此时采用简单随机抽样的方差公式可能偏于保守,高估了抽样误差。式可能偏于保守,高估了抽样误差。k42分层抽样分层抽样v方法方法:将总体分成若干独立层,各层内的样本量是独将总体分成若干独立层,各层内的样本量是独立抽取的,通常采用简单随机或等距抽样,不同层立抽取的,通常采用简单随机或等距抽样,不同层的样本量可以不同,抽选样本的方法可以不同。的样本量可以不同,抽选样本的方法可以不同。v条件:条件:总体中每个单位都能够分入其中一个层,需总体

    30、中每个单位都能够分入其中一个层,需要有相应的辅助信息要有相应的辅助信息分层依据。分层依据。v优点:组织实施方便,样本散布均匀,精度较高。优点:组织实施方便,样本散布均匀,精度较高。一是将单位差异较小的单位放在同一层,减少层内一是将单位差异较小的单位放在同一层,减少层内方差;二是在总样本量不变的情况下,控制各层中方差;二是在总样本量不变的情况下,控制各层中的样本量,方差大层多分配样本,减少抽样误差。的样本量,方差大层多分配样本,减少抽样误差。企业调查中,分布呈现偏态,分层效果非常明显。企业调查中,分布呈现偏态,分层效果非常明显。43二阶与多阶抽样二阶与多阶抽样v方法方法:先将先将总体划分为若干个

    31、群,随机抽取一部分,总体划分为若干个群,随机抽取一部分,然后在每个抽中的群中随机抽取要调查的单位。这是然后在每个抽中的群中随机抽取要调查的单位。这是二阶抽样,可以在群内进一步分群,每个群内进行二二阶抽样,可以在群内进一步分群,每个群内进行二阶段抽样,形成三阶或多阶抽样。阶段抽样,形成三阶或多阶抽样。v前提条件:没有企业名录;调查组织机构出于组织管前提条件:没有企业名录;调查组织机构出于组织管理和成本方面的考虑,如相对于样本量小但很分散,理和成本方面的考虑,如相对于样本量小但很分散,愿意选择数量大但相对集中的样本。愿意选择数量大但相对集中的样本。v优点:样本相对集中,不需要包含所有单位的抽样框。

    32、优点:样本相对集中,不需要包含所有单位的抽样框。v缺点:抽样时较为麻烦,而且从样本对总体的估计比缺点:抽样时较为麻烦,而且从样本对总体的估计比较复杂较复杂 。效率低。效率低。44整群抽样整群抽样v是二阶段抽样的一种特殊情况,方法是二阶段抽样的一种特殊情况,方法:先将先将总体划分总体划分为若干个群,随机抽取一部分,然后在每个抽中的为若干个群,随机抽取一部分,然后在每个抽中的群中抽取所有的单位。群中抽取所有的单位。v条件:必须有全部群单位的名录。条件:必须有全部群单位的名录。v优点:不要求有每个二级单位的抽样框;优点:不要求有每个二级单位的抽样框;便于实便于实施施 。v缺点:精度较差,效率不高。缺

    33、点:精度较差,效率不高。45不等概率抽样不等概率抽样v方法:抽选的概率与群的大小成比例方法:抽选的概率与群的大小成比例。大单位被抽。大单位被抽到的概率大,小单位抽到的概率小。到的概率大,小单位抽到的概率小。PPSPPS,目录抽,目录抽样中,按每个单位规模(营业收入、从业人数)占样中,按每个单位规模(营业收入、从业人数)占总体规模的比重成比例的概率抽取样本。总体规模的比重成比例的概率抽取样本。v条件:必须有全部群单位规模的辅助信息,且规模条件:必须有全部群单位规模的辅助信息,且规模指标与估计指标相关程度高。指标与估计指标相关程度高。v优点:群优点:群单位大小不相等时,单位大小不相等时,精度较高,

    34、数据处理精度较高,数据处理也不复杂也不复杂 。46二重抽样二重抽样v方法方法:抽样时分两次抽取样本。先从总体中抽取一个抽样时分两次抽取样本。先从总体中抽取一个较大样本,称第一重样本,对一重样本进行调查搜集较大样本,称第一重样本,对一重样本进行调查搜集某些信息,然后从中抽取一部分样本某些信息,然后从中抽取一部分样本第二重样本,第二重样本,对抽中的第二重样本再次进行调查,进一步搜集有关对抽中的第二重样本再次进行调查,进一步搜集有关信息。信息。v前提条件:前提条件:抽样框缺乏辅助信息抽样框缺乏辅助信息,需要对总体进行需要对总体进行分层分层 。v优点:提高抽样效率优点:提高抽样效率 。v缺点:缺点:在

    35、抽取一重样本时需要增加一定的费用,只有在抽取一重样本时需要增加一定的费用,只有当利用这些信息进行分层抽样,所提高的精度的得益当利用这些信息进行分层抽样,所提高的精度的得益大于所增加的费用时,采用二重抽样才是合算的大于所增加的费用时,采用二重抽样才是合算的。47二重抽样与两阶段抽样二重抽样与两阶段抽样v两阶段抽样是先从总体中抽取一定规模的样本(初级抽样单位PSUs),并不对初级抽样单位中的所有二级单位都调查,而是在其中再抽出若干个二级单位进行调查;二重抽样则不同,要对第一重样本进行调查以获取总体的某些辅助信息,并且要利用这些辅助信息进行分层或估计。v两阶段抽样中二级抽样单位与一级抽样单位是不同的

    36、,如一级抽样单位是居委会,二级抽样单位是个体户;而二重抽样两次的抽样单位是相同的。48四、四、抽样方法的选择v确定抽样方法的原则确定抽样方法的原则有效原则:在样本量一定的前提下,误差要小;或在一定精度前提下,样本量要少。如分层抽样,效率高。经济原则:费用要低。精度与费用是评价抽样设计优劣的准则。最优的抽样设计:在费用一定的前提下,达到精度最高;或在满足精度的要求下,调查费用最少。易操作原则:容易组织实施。适应抽样框的原则:充分利用抽样框及已有的信息实际中,原则不能同时兼顾,权衡利弊,选择抽样方法。49抽样方法的选择(续1)v企业抽样方法的选择企业抽样方法的选择目录抽样经济普查建立了名录库,每年

    37、两次的维护更新制度;目录抽样设计简单,进行分层后,效率高样本量确定的前提下,分层提高精度;或在精度确定的前提下,分层能减少样本量;缺点:以省为总体进行抽样,样本分布分散。50抽样方法的选择(续)世界先进国家对产业活动单位调查,基本都采用目录抽样,具备及时更新维护的名录库。为减轻小企业回答负担,采用税务数据替代的方法。如加拿大Royce-Maranda界限方法,分层后每个单元格单位收入-以下的单位不发表调查,采用税务数据。借鉴经验,权衡利弊,企业选择目录抽样。注意:选择目录抽样方法,就要发挥其方法的优势时,接受其弊端样本分散。(把样本集中到有调查队的县或地市)。51抽样方法的选择(续)v个体抽样

    38、方法的选择个体抽样方法的选择二阶段整群抽样(第一阶段):以省为总体,第一阶段抽取县区,第二阶段抽取样本县区内的村/居委会,对抽中村/居委会中的个体户全部进行调查。个体户无名录;建立个体户名录难度大;个体户变动频繁。52抽样方法的选择(续)二阶段抽样(目前):首先在由村/居委会构成的一阶段抽样框中抽取村/居委会,在抽中的村/居委会中(利用经济普查时清查的所有在调查范围内的个体户的名单,维护后采用简单随机方式从中)抽取个体户样本进行调查。对于个体户数多的的群(居村委会)采用二阶段抽样。解决调查量大的问题。通过一阶段整群,将大群划小,也能解决调查量大的问题。省里更愿意使用二阶段抽样。53五、对抽样调

    39、查的基本认识对抽样调查的基本认识v关于对抽样调查准确性的认识关于对抽样调查准确性的认识准确(准确(accuracyaccuracy):客观的真值):客观的真值 精确(精确(precisionprecision):大量计量结果的均):大量计量结果的均值值,多次调查结果的摆动愈小就愈精确。v关于样本对总体代表性问题的认识关于样本对总体代表性问题的认识 只要抽样是概率抽样,抽得的样本对总体的代表性都是有保证的。54对抽样调查的基本认识对抽样调查的基本认识(续续)v关于概率抽样局限性的认识关于概率抽样局限性的认识“抽样调查不能满足分级管理需要的认识”通过扩大各级样本量来满足;可行性问题。来自来自 中国

    40、最大的资料库下载中国最大的资料库下载 55服务业抽样调查概况56主要内容v企业抽样设计v个体抽样设计57抽样设计u调查范围和总体行业范围:装卸搬运和其他运输服务业、仓储业、计算机服务业、软件业、租赁业、商务服务业、科技交流和推广服务业、居民服务业、其他服务业、社会福利业、体育和娱乐业12个行业大类。调查对象:法人企业和个体户。调查总体划分为企业子总体和个体子总体。58抽样设计(续1)目标总体:2007年1至11月正常营业的法人企业和个体户。在调查期(2007年12月)正常营业的法人企业和个体户。抽样总体:2006年营业、停业和筹建的法人企业;2004年经济普查时的所有居/村委会。59抽样设计(

    41、续2)u估计精度要求:以省12个服务员行业为总体控制抽样精度,在95的概率保证程度下,营业收入的cv控制在5以内。60抽样设计(续3)u基本抽样方法企业:目录抽样,直接从企业名录库中抽取样本企业。个体二阶段抽样第一阶段抽取样本村/居委会;第二阶段在样本村/居委会中抽取个体户。个体一阶段整群抽样,直接抽取样本村/居委会,对抽中的样本村/居委会中的个体户全部进行调查。61抽样设计(续4)u调查目标 估计全省(市)总体总量指标;估计全省(市)企业子总体和个体子总体总量指标。62企业抽样设计u搜集整理抽样框抽样框使用普查中心维护后的名录库。由总队到省统计局普查中心去搜集。然后整理为国家要求的格式。u样

    42、本量类似调查的经验;相关测算;人力、物力、时间和精度等因素。63企业抽样设计(续1)2006年1至11月调查为例,国家首先确定14000个企业样本;行业:按每个行业大类的差异大小分配样本;地区:参考收入比重(某省营业收入/全国营业收入)确定各省样本量;迭代方法:将样本量分配到各省的各行业。64企业抽样设计(续2)u分层和分配样本量(省级)按行业大类分层;在行业大类中划分必调查层和抽样调查层。国家标准 必调查层界限.xls抽样层按营业收入分层(累积平方根2-4层)分配样本(大企业层抽样比高)按行业小类进一步分层在行业小类内等比例分配样本65企业抽样设计(续3)u抽取样本采用永久随机数技术v样本抽

    43、取方法.xls66利用随机数在层内抽取5个样本67企业抽样设计(续4)u区分有效和无效样本有效样本:调查时点仍然属于服务业抽样调查统计范围的样本单位;无效样本:调查时点已经不属于服务业抽样调查统计范围的样本单位。未完成报表的样本企业原因说明.doc 68企业抽样设计(续5)u加权基础权数:一个样本单位所代表总体单位的数量,样本单位抽中概率的倒数。无回答加权调整:基础权数乘以无回答加权调整因子。总量和方差估计:stata软件69企业抽样设计(续6)新增企业的处理 由于抽样框中资料的时点与调查时点存在差异,在调查时会遇到新增企业问题。新增企业指企业没有列入抽样框,但在调查时已经产生,如新建企业或由

    44、其他行业改行而来的企业。从普查中心搜集相关信息,计算企业个数净增速,调整非必调查层。70个体抽样设计二阶段抽样u整理抽样框 一阶段抽样框:2005年试点调查时在经济普查基础上整理的居/村名录(个体户数或收入信息)。二阶段抽样框:抽中居/村内个体户名单71个体抽样设计(续1)u确定一阶段样本量u一阶段抽样框分层与分配样本 分层:按收入或户数。分配样本:规模大层抽样比要高。u抽取一阶段整群样本:随机数u确定二阶段样本量:所承受的工作量u抽取二阶段样本72个体抽样设计(续6)u加权和估计加权:基础权数等于一阶段权数和二阶段权数之积。估计:Stata软件。73企业抽样调查实例74确定调查总体调查范围和

    45、总体(以一个省为例)行业范围:租赁和商务服务业、居民服务和其他服务业目标总体:2005年正常营业的法人企业和个体户。在调查期(2006年3月)正常营业的法人企业和个体户。抽样总体:2004年营业、停产和筹建的法人企业;2004年所有的居/村委会,无论是否有个体户。75估计精度要求按行业门类营业收入控制精度在95%概率保证程度下,租赁和商务服务业营业收入的最大相对误差控制在10%以内在95%概率保证程度下,居民服务和其他服务业营业收入的最大相对误差控制在10%以内76整理抽样框按行业范围整理:按抽样总体整理:营业状态中包括当年关闭和破产的企业,要剔除检查是否有重复、一对多或多对一的情况,要进行处

    46、理新增企业要单独考虑:使用2004年经济普查库,不能反映2005年新增企业部分77确定样本量经验:租赁和商务服务1000800 居民服务业和其他服务560 500测算:样本量测算bj.xls承受的工作量非单一指标78分层与分配样本量确定必调查层(经验)北京切割点bj.xls按营业收入分层(累积平方根)分配样本(大企业层抽样比高,层间抽样比相差不要太大)分层结果bj.xls79分层与分配样本量按行业进一步分层(观察小类分布)等比例分配样本 分层结果bj.xls按营业收入再分层(如果必要)等比例分配样本分层结果bj.xls80抽取样本永久随机数技术永久随机数(PRN)概念与作用产生方法产生随机数.

    47、xls检验分布的合理性 随机数分布bj.xls抽取样本方法81加权方法权数:一个样本单位代表的总体单位数量,样本单位抽中概率的倒数设计权数分层结果bj.xls加权调整(无回答)有效样本:数据收集期内属于调查范围 有效无回答样本加权调整:设计权数有效样本数/回答样本个数无效样本:数据收集期内不属于调查范围无效有效样本分布bj.xls无效样本参加方差计算82企业总量与方差估计总量估计方差估计:Stata软件 泰勒级数法 估计结果调查结果bj.xls83新增企业的处理搜集新增企业名单(法人代码和企业名称);与抽样框核对,确定实际新增企业单位数;假定:限下新增企业单位数分布与抽样框中的企业单位数分布一致;调整权数:7374与8283分别调整权数权数乘以企业发展速度估计结果 推算汇总4bj.xls来自来自 中国最大的资料库下载中国最大的资料库下载 84谢谢!

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:企业抽样调查知识与实例分析(-84张)课件.ppt
    链接地址:https://www.163wenku.com/p-3998269.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库