第4章-抽样调查技术要点课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第4章-抽样调查技术要点课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样调查 技术 要点 课件
- 资源描述:
-
1、北京邮电大学世纪学院抽样调查技术抽样调查技术韩 璐重点章节重点章节 为了获取总体的信息及特征,可以选择普查和抽样调为了获取总体的信息及特征,可以选择普查和抽样调查两种方法。总的来说,与普查相比抽样调查具有经济、查两种方法。总的来说,与普查相比抽样调查具有经济、及时、准确和高效的特点。及时、准确和高效的特点。普遍调查普遍调查抽样调查抽样调查 需要投入大量的人、财、物和时间需要投入大量的人、财、物和时间 获取的信息全面,但准确性未必高获取的信息全面,但准确性未必高 在对精度要求小,但是对整体状况详在对精度要求小,但是对整体状况详细性要求高时可采用这种方法,比如细性要求高时可采用这种方法,比如人口普
2、查,农业普查、企业员工整体人口普查,农业普查、企业员工整体素质普查等。素质普查等。 时间短、效率高,投入资源较少时间短、效率高,投入资源较少 调查结果的正确性较高,但是获取调查结果的正确性较高,但是获取的信息全面性不如普查的信息全面性不如普查 可以通过统计推断技术来估计调查可以通过统计推断技术来估计调查总体的各项指标,是企业经常使用总体的各项指标,是企业经常使用的调查研究方法。的调查研究方法。普查与抽样调查普查与抽样调查抽样调查的定义抽样调查的定义 抽样调查又称样本调查,是指按照随机原则,抽样调查又称样本调查,是指按照随机原则,从研究总体个单位中,抽取部分单位作为样本,从研究总体个单位中,抽取
3、部分单位作为样本,按照以样本的调查结果对总体的数量特征做出具按照以样本的调查结果对总体的数量特征做出具有一定可靠度和精确度的估计或推断的一种调查有一定可靠度和精确度的估计或推断的一种调查方法方法。抽样调查的理论基础是概率论。抽样调查的理论基础是概率论。抽样调查是什么?抽样调查是什么? 抽样调查要遵循随机原则吗?抽样调查要遵循随机原则吗? 需要从研究总体中抽取样本需要从研究总体中抽取样本 吗?吗? 能够可靠或准确的估计总体样本吗?能够可靠或准确的估计总体样本吗? 有理论基础吗?有理论基础吗?概率论概率论简单随机抽样简单随机抽样系统抽样系统抽样整群抽样整群抽样分层抽样分层抽样方便抽样方便抽样配额抽
4、样配额抽样滚雪球抽样滚雪球抽样判断抽样判断抽样抽样方法抽样方法概率抽样概率抽样非概率抽样非概率抽样抽样调查的分类抽样调查的分类概率抽样概率抽样非概率抽样非概率抽样两种抽样的区别两种抽样的区别概率抽样又称随机抽样,是指按照随机概率抽样又称随机抽样,是指按照随机原则抽取样本,在抽取样本时排除主观原则抽取样本,在抽取样本时排除主观因素影响,不进行有意识的挑选,使每因素影响,不进行有意识的挑选,使每个单位都有一定机会被抽中。个单位都有一定机会被抽中。非概率抽样,它不遵循随机原则,而非概率抽样,它不遵循随机原则,而是从方便、快捷出发抽取样本,或是是从方便、快捷出发抽取样本,或是根据主观有目的地挑选样本。
5、根据主观有目的地挑选样本。 遵循随机原则遵循随机原则 客观抽样客观抽样 每个单位都有相同机会每个单位都有相同机会 不遵循随机原则不遵循随机原则 主观判断抽样主观判断抽样 方便、快捷的抽取样本方便、快捷的抽取样本优:从概率样本中获得的信息含量较高。优:从概率样本中获得的信息含量较高。缺:抽取样本技术复杂,必须有合适的缺:抽取样本技术复杂,必须有合适的样本框,成本较高,对抽样人员专业技样本框,成本较高,对抽样人员专业技术要求高。术要求高。优:操作简便、时效快、成本低,适合优:操作简便、时效快、成本低,适合做探索性研究和预调查。做探索性研究和预调查。缺:无法估计和控制误差,无法用统计缺:无法估计和控
6、制误差,无法用统计方法来推断总体。方法来推断总体。 第一步:定义有关的总体第一步:定义有关的总体抽样方案的设计步骤抽样方案的设计步骤第二步:获得总体的名单第二步:获得总体的名单第三步:设计样本方案第三步:设计样本方案明确总体:明确总体:1 1)抽样的单位是什么?(家庭还)抽样的单位是什么?(家庭还是个人)是个人)2 2)时间限制,需要获取哪一时间)时间限制,需要获取哪一时间段的信息?段的信息?3 3)空间限制,局限于哪个区域的)空间限制,局限于哪个区域的信息?信息?建立抽样框建立抽样框1 1)所有的样本均从抽样框中得到)所有的样本均从抽样框中得到2 2)抽样框误差会影响分析结果的)抽样框误差会
7、影响分析结果的可靠性可靠性确定样本数量和抽样方法确定样本数量和抽样方法1 1)确定抽样数量)确定抽样数量2 2)根据样本特征选择抽样方法)根据样本特征选择抽样方法概率抽样概率抽样简单随机抽样简单随机抽样 简单随机抽样又称单纯随机抽样、纯简单随机抽样又称单纯随机抽样、纯随机抽样、无限制随机抽样,它对调查总随机抽样、无限制随机抽样,它对调查总体不经过任何分组、排队,完全凭着偶然体不经过任何分组、排队,完全凭着偶然的机会从中抽取个体加以调查。的机会从中抽取个体加以调查。(1)(1)抽签法抽签法该方法适用于调查总体中个体数目较少的情况。该方法适用于调查总体中个体数目较少的情况。例如:北京小轿车摇号例如
8、:北京小轿车摇号(2)(2)随机数字表法随机数字表法该方法需要使用摇码器生成乱数表,而后在从中该方法需要使用摇码器生成乱数表,而后在从中抽取,也是适用于数量不大的总体。抽取,也是适用于数量不大的总体。随机数字表随机数字表0947437386162294773997742467628482532731167662276663017863591256859926332134122955595635645760328644从第从第1 1行第行第4 4列开始抽取,小于列开始抽取,小于7070的数。如果样本不够那么再的数。如果样本不够那么再从其他列抽取,直至抽够为止。从其他列抽取,直至抽够为止。(3)(
9、3)计算机抽取计算机抽取使用统计软件中都有的抽取随机样本的功能,使用统计软件中都有的抽取随机样本的功能,从中抽取,该方法简便快捷,但是需要注意,从中抽取,该方法简便快捷,但是需要注意,软件生成的随机数是伪随机数,随机效果并软件生成的随机数是伪随机数,随机效果并不理想。不理想。例如:商场让个人用电脑抽奖的活动例如:商场让个人用电脑抽奖的活动简单随机抽样的优点及局限性简单随机抽样的优点及局限性优点:优点:方法简单,易操作,理论上是最符合随机原则的。方法简单,易操作,理论上是最符合随机原则的。简单随即抽样适用于总体的个数不太庞大,总体分布简单随即抽样适用于总体的个数不太庞大,总体分布较为均匀的情况。
10、较为均匀的情况。局限性:局限性:(1 1)采用简单抽样必须对个体进行编号,当总体样本巨大,)采用简单抽样必须对个体进行编号,当总体样本巨大,且不断产生时逐一编号比较困难。且不断产生时逐一编号比较困难。(2 2)当调查总体的标志变异程度较大时,简单抽样的代表性)当调查总体的标志变异程度较大时,简单抽样的代表性就会下降。就会下降。(3 3)简单抽样样本较为分散,需要的调查投入较大。)简单抽样样本较为分散,需要的调查投入较大。系统抽样系统抽样系统抽样是指将总体中的单位按某种系统抽样是指将总体中的单位按某种顺序排列顺序排列,在规定的范围,在规定的范围内随即抽取起始单位,然后按一定的规则确定其他样本单位
11、的内随即抽取起始单位,然后按一定的规则确定其他样本单位的抽样方法。抽样方法。抽选距离抽选距离= =N Nn n=k=kNN调查总体数;调查总体数;nn样本数;样本数;kk最接近最接近N/nN/n的整数。的整数。排序的标志:排序的标志: 按与调查项目无关的标志排序,如电话号码按与调查项目无关的标志排序,如电话号码排序;排序; 按与调查项目有关的标志排序,如最近购买时间。按与调查项目有关的标志排序,如最近购买时间。例:从某小区例:从某小区600600户家庭中抽选户家庭中抽选5050户进行消费习惯调查,可以户进行消费习惯调查,可以利用小区物业管理的现有名册按顺序编号排序,从第利用小区物业管理的现有名
12、册按顺序编号排序,从第1 1号编至号编至600600号。号。抽选距离抽选距离= =N Nn n=12=126006005050= =抽取方式:从第一个抽取方式:从第一个1212户中用简单随即抽样的方式抽取第户中用简单随即抽样的方式抽取第1 1个样本个体,假如抽到的是个样本个体,假如抽到的是8 8号,则后续依次抽中号,则后续依次抽中2020号号3232号号4444号号,直至抽够,直至抽够5050户为止。户为止。系统抽样的优点及局限性系统抽样的优点及局限性局限性:局限性:(1 1)需要调查总体中每个个体的详细材料,尤其是按有关标)需要调查总体中每个个体的详细材料,尤其是按有关标志排序时,较为困难;
13、志排序时,较为困难;(2 2)当抽选间隔与被调查本身的节奏性相重合时会影响调查)当抽选间隔与被调查本身的节奏性相重合时会影响调查精度。精度。系统抽样适用于总体时间周期性不强的情况。系统抽样适用于总体时间周期性不强的情况。优点:优点:操作简便,只要随即确定一个起始单位整个样本就可以确定操作简便,只要随即确定一个起始单位整个样本就可以确定了。当研究对象的标志变异程度较大,又不可能抽取更多样了。当研究对象的标志变异程度较大,又不可能抽取更多样本个体时,这种方法能比较均匀的调查总体。本个体时,这种方法能比较均匀的调查总体。例:对军队中士兵对待战争的积极性进行调查,采用例:对军队中士兵对待战争的积极性进
14、行调查,采用系统抽样的方法,将士兵的编号按班排序(每班系统抽样的方法,将士兵的编号按班排序(每班1010人),进行抽样,从人),进行抽样,从1 1号开始抽取,接下来是号开始抽取,接下来是1111号、号、2121号号,调查发现士兵对待战争的积极性很高。但,调查发现士兵对待战争的积极性很高。但是经过对样本进行研究发现,被抽到的士兵都是每班是经过对样本进行研究发现,被抽到的士兵都是每班的班长,样本的代表性就有问题了!的班长,样本的代表性就有问题了!分层抽样分层抽样分层抽样,是指先将调查总体的所有个体分层抽样,是指先将调查总体的所有个体按某一重要标志按某一重要标志进行进行分类(分组),然后在各类(组)
15、中采用简单随即抽样或系统分类(分组),然后在各类(组)中采用简单随即抽样或系统抽样方式抽取样本个体的抽样方法。抽样方式抽取样本个体的抽样方法。分层抽样主要是希望增加样本的代表性,避免单纯随机抽样的分层抽样主要是希望增加样本的代表性,避免单纯随机抽样的样本过于集中于某种特性或完全无某种特性。样本过于集中于某种特性或完全无某种特性。N=NN=Ni i=N=N1 1+N+N2 2+N+N3 3+N Nk k进行分层抽样时,先将整个母体按照各种特性划分成进行分层抽样时,先将整个母体按照各种特性划分成i i个副次母(层):个副次母(层):n=n=n ni i=n=n1 1+n+n2 2+n+n3 3+n
16、 nk k再由各层中随机抽取样本单位若干个,如再由各层中随机抽取样本单位若干个,如n n1 1,n n2 2,n nk k 根据样本在各层中分配方法不同,可以分为等比分层抽根据样本在各层中分配方法不同,可以分为等比分层抽样和非等比分层抽样两种方法。样和非等比分层抽样两种方法。1.1.等比分层抽样:按各层中个体数量占总体数量的比例分等比分层抽样:按各层中个体数量占总体数量的比例分配各层的样本数量。配各层的样本数量。例:某产品的用户共有例:某产品的用户共有50005000个,按用户的个,按用户的“年平均支出年平均支出”将其将其分为分为“大客户大客户”、“一般客户一般客户”和和“临时客户临时客户”。
17、从中抽取。从中抽取800800个用户进行消费者调查。个用户进行消费者调查。客户类型客户类型各层客户总数量各层客户总数量各层占比各层占比应抽取样本数应抽取样本数大客户大客户1250125025%25%800800* *25%=20025%=200一般客户一般客户2500250050%50%800800* *50%=40050%=400临时客户临时客户1250125025%25%800800* *25%=20025%=200等比分层抽样简便易行,分配合理,计算方便,适用于类等比分层抽样简便易行,分配合理,计算方便,适用于类型之间差异不大的分层抽样调查。型之间差异不大的分层抽样调查。2.2.非等比分
18、层抽样:按其他因素(如各层平均数或成数非等比分层抽样:按其他因素(如各层平均数或成数标准差的大小,抽样工作量或费用的大小等)调整各层标准差的大小,抽样工作量或费用的大小等)调整各层的样本个体数。的样本个体数。非等比分层抽样主要在于减低各层之间的标准差,使母非等比分层抽样主要在于减低各层之间的标准差,使母体平均数的估计更加精确。体平均数的估计更加精确。n ni i= = n nN Ni iS Si iN Ni iS Si in ni i各层应抽出的样本数;各层应抽出的样本数;nn总样本数;总样本数;N Ni i各层的调查单位总数;各层的调查单位总数;S Si i各层调查单位的标准差。各层调查单位
19、的标准差。非等比分层抽样适用于各层之间相差悬殊或标准差相差较非等比分层抽样适用于各层之间相差悬殊或标准差相差较大的情况。大的情况。例:某产品的用户共有例:某产品的用户共有50005000个,按用户的个,按用户的“年平均支出年平均支出”将其将其分为分为“大客户大客户”、“一般客户一般客户”和和“临时客户临时客户”。从中抽取。从中抽取800800个用户进行消费者调查。个用户进行消费者调查。客户类型客户类型各层客户总各层客户总数量数量N Ni i样本标准样本标准差差S Si iN Ni iS Si i乘积乘积抽取的样本抽取的样本大客户大客户125012501001001250001250008008
20、00* *0.17=1360.17=136一般客户一般客户25002500150150375000375000800800* *0.5=4000.5=400临时客户临时客户12501250200200250000250000800800* *0.33=2640.33=264N=5000N=5000750000750000800800可以看出,标准差较大的抽取的样本个体也较多,这样可可以看出,标准差较大的抽取的样本个体也较多,这样可以平衡标准差的作用。但准确了解各组标志值变异程度的以平衡标准差的作用。但准确了解各组标志值变异程度的大小比较困难。大小比较困难。分层抽样的优点及局限性分层抽样的优点及
21、局限性优点:优点:把科学分组方法和抽样原理结合,能划分出性质比较接近的组,把科学分组方法和抽样原理结合,能划分出性质比较接近的组,以减少标志值之间变异程度,然后按随机原则,可以保证大数以减少标志值之间变异程度,然后按随机原则,可以保证大数法则的准确运用。比前两种抽样更准确,能得到比较准确的推法则的准确运用。比前两种抽样更准确,能得到比较准确的推断,尤其是总体数目较大,内容结构复杂时。断,尤其是总体数目较大,内容结构复杂时。分层抽样优点较多,局限性较小,是调查中常用的分层抽样优点较多,局限性较小,是调查中常用的抽样方法。抽样方法。 局限性:局限性:(1 1)在调查前准确了解各组标志值变异程度大小
22、比较困难。)在调查前准确了解各组标志值变异程度大小比较困难。(2 2)划分层次时,应尽量使)划分层次时,应尽量使各层之间具有显著性差异各层之间具有显著性差异,不致混,不致混淆。分层数目也不宜过多,淆。分层数目也不宜过多,各层内各单位应尽量保持相似各层内各单位应尽量保持相似。整群抽样整群抽样整群抽样也叫分群抽样,是指将总体分解为群,抽样直接抽取整群抽样也叫分群抽样,是指将总体分解为群,抽样直接抽取群,对抽中群中的个体单位全部或随机抽取部分进行调查(一群,对抽中群中的个体单位全部或随机抽取部分进行调查(一级整群抽样、二级整群抽样、三级整群抽样),以此来推断总级整群抽样、二级整群抽样、三级整群抽样)
23、,以此来推断总体的一般特性。体的一般特性。整群抽样时,整群抽样时,各群的特性应尽量保持相近各群的特性应尽量保持相近,如人口、经济等。,如人口、经济等。但但每一群内部则应具有差异性每一群内部则应具有差异性。如:初级调查单位(如地区):具有相同性如:初级调查单位(如地区):具有相同性 次级调查单位(如家庭):具有差异性次级调查单位(如家庭):具有差异性整群抽样与分层抽样刚好相反:整群抽样与分层抽样刚好相反:高收入层高收入层高收入高收入高收入高收入高收入高收入中等收入层中等收入层中等收入中等收入中等收入中等收入中等收入中等收入低收入层低收入层低收入低收入低收入低收入低收入低收入分层抽样分层抽样第一群
24、第一群高收入高收入第二群第二群中等收入中等收入第三群第三群低收入低收入整群抽样整群抽样高收入高收入中等收入中等收入低收入低收入高收入高收入中等收入中等收入低收入低收入思考:思考:1 1、调查某产品消费者可支配收入去向时,可采、调查某产品消费者可支配收入去向时,可采用哪种方法?用哪种方法?2 2、调查一线城市消费者耐用品消费状况时,可、调查一线城市消费者耐用品消费状况时,可采用哪种方法?采用哪种方法?3 3、调查北京地区高校大学生用于购买电脑消费、调查北京地区高校大学生用于购买电脑消费状况时,可采用哪种方法?状况时,可采用哪种方法?分层抽样分层抽样整群抽样整群抽样整群抽样整群抽样分层抽样分层抽样
展开阅读全文