企业抽样调查知识与实例分析(-84张)课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《企业抽样调查知识与实例分析(-84张)课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 企业 抽样调查 知识 实例 分析 84 课件
- 资源描述:
-
1、来自来自 中国最大的资料库下载中国最大的资料库下载 1企业抽样调查2主要内容u抽样调查基本知识u服务业抽样调查概况u企业抽样调查实例来自来自 中国最大的资料库下载中国最大的资料库下载 3抽样调查基本知识4主要内容v抽样调查的基本概念抽样调查的基本概念v抽样调查的基本理论抽样调查的基本理论v基本抽样方法基本抽样方法v抽样方法的选择抽样方法的选择v对抽样调查的基本认识对抽样调查的基本认识5一、抽样调查的基本概念一、抽样调查的基本概念 v抽样调查抽样调查v概率抽样与非概率抽样概率抽样与非概率抽样v总体与样本总体与样本 v目标总体与抽样总体目标总体与抽样总体 v抽样框抽样框 v调查单位与抽样单位调查单
2、位与抽样单位 v误差误差 v误差限与置信度误差限与置信度 v抽样效率与设计效果抽样效率与设计效果 6抽样调查抽样调查v统计调查分为全面调查与非全面调查两类。抽样调统计调查分为全面调查与非全面调查两类。抽样调查是非全面调查中的一种重要方法,它是从所研究查是非全面调查中的一种重要方法,它是从所研究对象的全体(总体)中抽取一部分(样本)进行调对象的全体(总体)中抽取一部分(样本)进行调查,获取数据,并以此对总体目标量作出推断(估查,获取数据,并以此对总体目标量作出推断(估计)。这是广义的抽样调查概念。计)。这是广义的抽样调查概念。根据样本抽取方法的不同,抽样可分为概率抽样和根据样本抽取方法的不同,抽
3、样可分为概率抽样和非概率抽样。非概率抽样。7概率抽样概率抽样v概率抽样(概率抽样(probability samplingprobability sampling)也称随机抽样。)也称随机抽样。概率抽样是严格地按照给定的概率来抽取样本的。概率抽样是严格地按照给定的概率来抽取样本的。特点:特点:按一定的概率以随机原则抽取样本。随机不等与随便。按一定的概率以随机原则抽取样本。随机不等与随便。随机有严格的科学定义,可用概率来描述,而随机有严格的科学定义,可用概率来描述,而 随便带有人为或主观因素,它不是一个科学的概念。随便带有人为或主观因素,它不是一个科学的概念。8概率抽样概率抽样(续续)每个单位被
4、抽中的概率是已知的,或可计算每个单位被抽中的概率是已知的,或可计算出来。出来。当用样本对总体目标量估计时,要考虑到该当用样本对总体目标量估计时,要考虑到该样本抽中的概率,也就是说,估计量不仅与样本抽中的概率,也就是说,估计量不仅与样本观测值有关样本观测值有关,也与被抽中的概率有关。也与被抽中的概率有关。n通常所提到的抽样调查实际上指的就是概率通常所提到的抽样调查实际上指的就是概率抽样。抽样。n国际交流:企业抽样调查包括本行业所有规国际交流:企业抽样调查包括本行业所有规模的企业。模的企业。9非概率抽样非概率抽样v非概率抽样(非概率抽样(non-probability samplingnon-pr
5、obability sampling)是相对)是相对于概率抽样而言,并无严格的定义,不是按随机原于概率抽样而言,并无严格的定义,不是按随机原则来抽选的。这种抽样效果的好坏在很大程度上依则来抽选的。这种抽样效果的好坏在很大程度上依赖于抽样者的主观判断能力和经验,而且不能计算赖于抽样者的主观判断能力和经验,而且不能计算抽样误差,不能从概率意义上控制误差并以此来保抽样误差,不能从概率意义上控制误差并以此来保证推断的准确性。此外,即使经验可能已表明某种证推断的准确性。此外,即使经验可能已表明某种非概率方法过去曾有较好效果,但这并不能保证该非概率方法过去曾有较好效果,但这并不能保证该方法一直如此。不过尽
6、管有其理论上的弱点,各种方法一直如此。不过尽管有其理论上的弱点,各种形式的非概率抽样仍在实践中广泛采用,主要原因形式的非概率抽样仍在实践中广泛采用,主要原因是节省费用和方便。是节省费用和方便。10非概率抽样非概率抽样(续(续1)v通常我国的典型调查和重点调查通常我国的典型调查和重点调查,西方国家称为的西方国家称为的有目的抽样或判断抽样等都属于非概率抽样。有目的抽样或判断抽样等都属于非概率抽样。v如果调查的目的是用样本数据推断总体的目标量,如果调查的目的是用样本数据推断总体的目标量,并以一定的把握程度保证总体目标量落在目的范围,并以一定的把握程度保证总体目标量落在目的范围,这时非概率抽样是不合适
7、的。这时非概率抽样是不合适的。11总体和样本总体和样本v总体(总体(populationpopulation):总体就是全部被研究的单):总体就是全部被研究的单位位,也称研究总体。按研究的总体不同,总体单位也称研究总体。按研究的总体不同,总体单位可以是人、户或企业。在服务业抽样调查中,总可以是人、户或企业。在服务业抽样调查中,总体就是这些行业的企业和个体户。体就是这些行业的企业和个体户。v样本样本(sample)(sample):是总体的一部分,从总体中按一:是总体的一部分,从总体中按一定程序抽得的那部分个体或抽样单位。样本量定程序抽得的那部分个体或抽样单位。样本量n n对对总体总单位数总体总
8、单位数N N的比称为抽样比的比称为抽样比(sampling(sampling fraction)fraction):Nnf 12目标总体与抽样总体目标总体与抽样总体v目标总体(目标总体(target populationtarget population):是真正作为研究对):是真正作为研究对象的全体。如要研究山西省居民服务业的情况,目标总象的全体。如要研究山西省居民服务业的情况,目标总体就是所有从事居民服务业的企业和个体户。体就是所有从事居民服务业的企业和个体户。v抽样总体(抽样总体(sampling populationsampling population):是用作抽样的总):是用作抽样
9、的总体,也就是抽样框。体,也就是抽样框。v二者应一致,实际难做到。如目标总体是二者应一致,实际难做到。如目标总体是20062006年所有从年所有从事居民服务业的企业和个体户,但很难做到对在调查时事居民服务业的企业和个体户,但很难做到对在调查时(20072007年年1 1月)已消亡的单位的调查,尽管在调查时消月)已消亡的单位的调查,尽管在调查时消亡,但可能在亡,但可能在20062006年全年营业。年全年营业。v先定义目标总体,再根据条件进行修订得到抽样总体。先定义目标总体,再根据条件进行修订得到抽样总体。13总体参数与样本统计量总体参数与样本统计量v无论对总体还是样本,统计中通常使用平均数和标无
10、论对总体还是样本,统计中通常使用平均数和标准差等这样一些数量关系进行描述,它们被用于描准差等这样一些数量关系进行描述,它们被用于描述总体特征时,称为述总体特征时,称为总体参数总体参数,用于描述样本特征,用于描述样本特征时,称为时,称为样本统计量样本统计量。如:居民服务业抽取。如:居民服务业抽取800800家家企业,调查结果计算出企业平均营业收入企业,调查结果计算出企业平均营业收入400400万元万元(样本统计量),总体平均营业收入(总体参数)(样本统计量),总体平均营业收入(总体参数)未知。未知。v抽样目的是样本(样本统计量)推断总体(总体参抽样目的是样本(样本统计量)推断总体(总体参数)。如
11、用数)。如用800800家的平均营业收入作为总体平均营家的平均营业收入作为总体平均营业收入的估计值。业收入的估计值。14抽样框抽样框 v抽样框抽样框(sampling frame)(sampling frame):抽样框是指包含:抽样框是指包含所有抽样单位的名单或名册。由于抽样方法所有抽样单位的名单或名册。由于抽样方法不同不同,可有目录框和区域框可有目录框和区域框,分级抽样框。分级抽样框。名单中的每个单位都有可识别的基本信息;名单中的每个单位都有可识别的基本信息;名单的范围应是完整的,不重不漏。现实中使用的名单的范围应是完整的,不重不漏。现实中使用的抽样框并不十分完备,一方面,要改进和完善,如
12、抽样框并不十分完备,一方面,要改进和完善,如更新和维护;另一方面调查的设计者要认真分析抽更新和维护;另一方面调查的设计者要认真分析抽样框的状况,以评价框的不完整对调查结果产生的样框的状况,以评价框的不完整对调查结果产生的影响,并尽可能采取一些补救的办法。影响,并尽可能采取一些补救的办法。15调查单位与抽样单位调查单位与抽样单位v调查单位(调查单位(survey unitsurvey unit):抽样调查要通过):抽样调查要通过对样本单位的观察或调查来取得有关数据或对样本单位的观察或调查来取得有关数据或记录有关特征,这些单位称为调查单位。如记录有关特征,这些单位称为调查单位。如企业和个体户。企业
13、和个体户。v抽样单位抽样单位(sampling unit)(sampling unit):抽样单位是指将:抽样单位是指将总体划分成不重叠的有限多个部分的每个部总体划分成不重叠的有限多个部分的每个部分。区域、企业和个体户。分。区域、企业和个体户。16误差误差 v抽样误差(抽样误差(sampling errorsampling error):是由于用样):是由于用样本估计总体而产生的误差,也叫代表性误差。本估计总体而产生的误差,也叫代表性误差。v非抽样误差(非抽样误差(nonsampling errornonsampling error):是指):是指除抽样误差以外的,由于各种原因而引起的除抽样误
14、差以外的,由于各种原因而引起的误差,在各种方式的调查中都存在。误差,在各种方式的调查中都存在。17抽样框误差v遗漏单位与新增单位;遗漏单位与新增单位;v重复;重复;v辅助信息是否准确。辅助信息是否准确。18无回答误差v单位无回答;单位无回答;v项目无回答;项目无回答;v部分无回答。部分无回答。19设计误差v问卷设计引起的误差;问卷设计引起的误差;v抽样设计抽样设计(选用的方法、分层合理性选用的方法、分层合理性)及抽选及抽选过程过程(随机随机)引起的误差。引起的误差。20调查员引起的误差v调查员的责任心和态度;调查员的责任心和态度;v调查员水平。调查员水平。21被调查者引起的误差v无意识回答误差
15、;无意识回答误差;v有意识回答误差。有意识回答误差。22处理误差v编码;编码;v编辑录入;编辑录入;v加权;加权;v做表。做表。23点估计和区间估计点估计和区间估计v点估计:抽样调查用样本统计量直接作为总体参数点估计:抽样调查用样本统计量直接作为总体参数的估计值,称点估计。如用样本计算得到的企业平的估计值,称点估计。如用样本计算得到的企业平均营业收入作为总体企业的平均营业收入的估计值,均营业收入作为总体企业的平均营业收入的估计值,就是点估计。就是点估计。v区间估计:是对总体参数可能落入的一个数值范围区间估计:是对总体参数可能落入的一个数值范围作出的估计,估计值的取值范围称作出的估计,估计值的取
16、值范围称“置信区间置信区间”,与置信区间估计相联系的概率称与置信区间估计相联系的概率称“置信度置信度”,表示,表示置信区间估计包含了总体参数的可靠程度有多大。置信区间估计包含了总体参数的可靠程度有多大。24抽样效率与设计效果抽样效率与设计效果v抽样效率(抽样效率(sampling efficiencysampling efficiency):是指两):是指两个抽样方案的抽样方差之比;当某个估计量个抽样方案的抽样方差之比;当某个估计量的方差比另一估计量的方差小时,则称方差的方差比另一估计量的方差小时,则称方差小的估计量效率比较高。小的估计量效率比较高。v设计效果设计效果(design effec
17、t,(design effect,,简写为,简写为Deff)Deff):就是把一个设计方案的方差与简单随机抽样就是把一个设计方案的方差与简单随机抽样的方差进行比较。的方差进行比较。DeffDeff小于小于1 1时,表示设计方时,表示设计方案的效率高于简单随机抽样,反之,效率低案的效率高于简单随机抽样,反之,效率低于简单随机抽样。于简单随机抽样。25三种性质的分布三种性质的分布v总体分布(总体分布(population distributionpopulation distribution):是指研):是指研究对象这一总体的各个单位标志值的分布状况。究对象这一总体的各个单位标志值的分布状况。v样
18、本分布(样本分布(sample distributionsample distribution):样本单位标):样本单位标志值的的分布,就称为样本分布志值的的分布,就称为样本分布 。随着样本的增。随着样本的增多,样本分布逐渐接近总体分布。多,样本分布逐渐接近总体分布。v抽样分布:是指样本估计量的分布。如采用同样的抽样分布:是指样本估计量的分布。如采用同样的抽样方法和同等的样本量,在居民服务业企业中抽抽样方法和同等的样本量,在居民服务业企业中抽取多套样本,每套样本都能计算出一个估计量,所取多套样本,每套样本都能计算出一个估计量,所有可能的估计量形成的分布就是抽样分布。有可能的估计量形成的分布就是
19、抽样分布。26永久随机数永久随机数v随机数就是按随机方法而生成的数码。即随机数就是按随机方法而生成的数码。即0 0,1 1,2929这十个数字出现的机会是等概率的,但排列这十个数字出现的机会是等概率的,但排列的顺序是随机的。永久随机数(的顺序是随机的。永久随机数(Permanent Random Permanent Random NumbersNumbers)则是指长久使用、不改变的随机数。比)则是指长久使用、不改变的随机数。比如一个企业一旦被赋予了一个随机数,则在以后的如一个企业一旦被赋予了一个随机数,则在以后的调查中都使用这个随机数,它类似企业法人代码,调查中都使用这个随机数,它类似企业法
20、人代码,具有唯一和终身性。具有唯一和终身性。v对于样本轮换和不同调查中共享样本非常有用。对于样本轮换和不同调查中共享样本非常有用。v首先对每个单位赋予一个随机数,然后按随机数大首先对每个单位赋予一个随机数,然后按随机数大小顺序排队,抽取所需要的样本量。小顺序排队,抽取所需要的样本量。27概率概率v概率是指用来测定样本被抽中可能性大小的一个非负的数值。28权数权数v在概率抽样中,每个样本单位都代表调查总体中的一些未被抽中单位,通常,将一个样本单位所代表的总体单位的数量即样本单位抽中概率的倒数称为这个样本单位的设计权数或基础权数。29权数权数(续(续1 1)100个企业中抽10个企业,每个企业被抽
21、中的概率就是10/100=1/10,权数就是100/10=10,即一个样本企业代表了总体中的10个企业。分层抽样中,要在层内计算权数。如企业分成大、中、小3层。30分层抽样基础权数计算方法企业按规模分层总体中企业单位数样本 企业个数抽中概率基础 权数大型200200 200/200=11中型3000300300/3000=1/1010小型7000350350/7000=1/2020合计10200850850/10200=1/121231权数权数(续(续2 2)v最终权数与基础权数之间的关系最终权数等于基础权数:如果一项抽样调查不存在无回答或涵盖不全等情况,基础权数等于最终权数,可以直接用于估计
22、。最终权数在基础权数基础上进行调整:存在无回答情况(无回答多与少);范围涵盖不全;企业分开;企业重复。32权数权数(续(续3 3)n不同的抽样方法,权数是不一样的,即推算方法是不一样的。v目录抽样:基础权数=N/n,最终权数在基础权数基础上进行调整(无回答、范围涵盖不全)。v二阶段目录抽样:基础权数等于两个阶段权数之积。最终权数在基础权数基础上进行调整(无回答、范围涵盖不全),在两个阶段分别调整。如服务业个体抽样,第一阶段抽居村委会,基础权数等于层内居村委会个数样本居村委会个数;33权数权数(续(续4 4)第二阶段抽部分个体户,基础权数等于样本居村委会中个体户总数抽取的个体户数。为了避免权数调
23、整,调查中可规定:PSU和个体户不允许无回答;合并和分开的PSU,维持原状;对样本PSUs维护个体户数。fgtybn37.xls34权数权数(续(续5 5)v整群抽样:与目录抽样方法类似,只不过是将一个群当作一个样本单位对待。基础权数=N/n,最终权数在基础权数基础上进行调整(无回答、范围涵盖不全)。为了避免权数调整,调查中可规定:PSU和个体户不允许无回答;合并和分开的PSU,维持原状;对样本PSUs维护个体户数。35总量估计方法v各种抽样方法都有自己的总量估计计算方法,一些复杂抽样的总量估计计算公式比较复杂,但利用权数,各种抽样方法总量估计计算公式可统一、简单地表述为样本权数与指标值乘积的
展开阅读全文