第11章抽样方法剖析课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第11章抽样方法剖析课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 11 抽样 方法 剖析 课件
- 资源描述:
-
1、第十一章第十一章 抽样方法抽样方法抽样概述抽样概述常用的抽样方法常用的抽样方法 概率抽样概率抽样 非概率抽样非概率抽样 1234第一节第一节 抽样概述抽样概述 一、抽样的重要性一、抽样的重要性n由于研究对象的总体太大或受研究经费、人力和时间的限制,全面调查常常难以做到。n为了以较低的成本获得较准确的研究结果,全面调查很多情况下也是不必要的。n抽样就是从研究总体中选取一部分代表性样本的方法。二、调查研究分类二、调查研究分类n按调查设计的对象分:按调查设计的对象分:n普查n抽样调查 n典型调查 n按调查涉及的时间分:按调查涉及的时间分:n按调查时间的顺序为:n回顾性调查 n现况调查 n前瞻性调查
2、n从抽取样本的方式分:从抽取样本的方式分:n概率抽样调查n非概率抽样调查三、抽样的基本术语三、抽样的基本术语1总体(总体(population)n总体是指所研究对象的全体。组成总体的每个单位称为个体。n总体有研究总体和调查总体之分。n总体还可分为有限总体和无限总体。2样本(样本(sample)n样本与总体相对应,样本是从总体中抽取的一部分元素的集合,是总体中某些单位的子集。三、抽样的基本术语三、抽样的基本术语3.抽样(抽样(sampling)抽样是指从总体抽取部分个体的过程。根据抽样原则的不同,有不同的抽样方法。4.抽样单位(抽样单位(sampling unit)抽样单位是指被抽取样本中的一个
3、或是一组元素,是收集信息的基本单位。总体中的每个个体只属于一个单位。抽样单位和构成总体的元素有时相同,有时不同。三、抽样的基本术语三、抽样的基本术语5样本含量(样本含量(sample size)n样本含量是指调查抽取的样本所包含观察单位的数目。6.抽样框(抽样框(sampling frame)n抽样框又称做抽样范围,它指的是抽样过程中所包含的所有抽样单位的名单。三、抽样的基本术语三、抽样的基本术语7.参数值(参数值(parameter)n关于总体中某一变量的描述指标。8.统计量值(统计量值(statistic)n关于样本中某一变量的描述指标。9.抽样误差(抽样误差(sampling error
4、)n抽样误差是指样本统计值与被推断的总体参数值之差。三、抽样的基本术语三、抽样的基本术语10置信水平(置信水平(confidence level)n也称置信度,是指总体参数值落在样本统计值某一区间内的概率。置信水平反映的是样本统计量的精确度。在样本量相同的情况下,置信水平越高,置信区间越宽。11.置信区间(置信区间(confidence interval,CI)n是指在一定范围的置信水平下,样本统计值与总体参数值之间的误差范围。四、抽样的过程四、抽样的过程 1.界定总体界定总体 要明确总体的范围、内容和时间。调查研究内容的不同,对总体的限定也会有所不同。2.制定抽样框制定抽样框 根据界定的总体
5、范围,收集总体中全部抽样单位的名单,列出名册或排序编号,以确定总体的抽样范围和结构。3.选择抽样方法,确定抽样的精确性程度与样本选择抽样方法,确定抽样的精确性程度与样本规模规模四、抽样的过程四、抽样的过程4.样本量的估算样本量的估算(1)样本量估算的意义 样本含量过大或过小都有其弊端,确定合适的样本规模是抽样设计中的一项重要内容。(2)样本量估算的依据n总体中个体的变异程度n精度n置信程度(3)样本量的估计方法 常用的有经验法、查表法和计算法。四、抽样的过程四、抽样的过程5.实际抽取样本实际抽取样本 在前述步骤的基础上,严格按照所选定的抽样方法和确定的样本量大小,从抽样框中抽取相应的抽样单位,
6、构成调查样本。6.评估样本质量评估样本质量 主要对样本的代表性和偏差等进行评估,评估的主要标准是样本的准确性和精确性。第二节第二节 常用的抽样方法常用的抽样方法一、抽样方法的分类一、抽样方法的分类1.概率抽样(概率抽样(probability sampling)概率抽样又称随机抽样,是按照概率论和数理统计的原理从调查研究的总体中,根据随机原则进行抽样,排除人的主观因素,组成总体的每个单位都有被抽中的概率(非零概率)。n等概率抽样n单纯随机抽样n系统抽样n分层抽样n整群抽样n多阶段抽样n按规模成比例抽样n不等概率抽样 一、抽样方法的分类一、抽样方法的分类2.非概率抽样(非概率抽样(Non-pro
7、bability sampling)非概率抽样又称非随机抽样,主要是依据研究者的主观意愿、判断或是否方便等进行的抽样(非随机的),使得组成总体的很大部分单位没有被抽中的机会(零概率),因此调查很容易出现倾向性偏差。n偶遇抽样n立意抽样 n配额抽样n滚雪球抽样n同伴推动抽样法概率抽样和非概率抽样方法的比较概率抽样和非概率抽样方法的比较概率抽样概率抽样非概率抽样非概率抽样抽样原则抽样原则根据随机原则进行抽样,组成总体的每个单位都有被抽中的概率,客观性强非随机抽出样本,主观性强作用作用以部分推断总体研究总体的局部现象误差的估计误差的估计能计算和判断抽样误差不能计算和判断抽样误差优点优点科学规范,抽取
8、的样本具有一定的代表性,可以从调查结果推断总体省钱、省事、灵活方便;可以根据某些样本特征对样本进行控制,适用于小群体缺点缺点费时、费钱、不够灵活方便;操作比较复杂不够科学规范,有选择偏差,不能保证样本的代表性,不能推断总体二、概率抽样二、概率抽样单纯随机抽样单纯随机抽样1.抽样方法:抽样方法:具体做法是将调查总体的全部观察单位编号,按照抽签法或随机数法随机抽取部分观察单位组成样本。(1)抽签法抽签法 把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。(2)随机数法)随机数法 利用随机数字表、随机数骰子或计算
9、机产生的随机数进行抽样。二、概率抽样二、概率抽样单纯随机抽样单纯随机抽样n优点:优点:操作简单,是最简单的抽样技术,均数(或率)及标准误的计算简便,有标准的统计公式。n缺点:缺点:总体较大时,难于对总体中的个体一一编号。二、概率抽样二、概率抽样单纯随机抽样单纯随机抽样2.单纯随机抽样的样本量的估算方法:单纯随机抽样的样本量的估算方法:(1)连续型变量总体均数估计的样本量 其中:为相对误差,为变异系数,即总体标准差与总体均数之比22/VZn二、概率抽样二、概率抽样单纯随机抽样单纯随机抽样(2)01变量总体概率估计的样本量 采用以下公式进行样本量的计算:其中:为相对误差,为概率P的变异系数:PPZ
10、n222/)1(VPppV)1(二、概率抽样二、概率抽样系统抽样系统抽样 又称机械抽样或等距抽样,先将总体的全部观察单位按与研究现象无关的特征顺序排列,并编号,根据需要的样本含量大小,按照事先规定的某种规则抽样。其中最常采用的是等距离抽样,即根据总体单位数和样本含量的要求计算出抽选间隔,然后随机确定起点,每隔相同的间隔机械地依次抽取一个个观察单位组成样本。二、概率抽样二、概率抽样系统抽样系统抽样1.抽样方法:抽样方法:(1)先将总体从1N相继编号,并按以下公式计算抽样距离:抽样距离k=N/n(2)确定抽样起点。(3)将抽样起点作为样本的第一个单位,接着取ik、i2k,直至抽够n个单位为止。二、
11、概率抽样二、概率抽样系统抽样系统抽样 例如:例如:在1000户居民中随机抽取200户作样本,抽样距离为50,随机确定起点为门牌号10,即按10、60、110、160、的门牌号抽取所需观察单位组成样本。二、概率抽样二、概率抽样系统抽样系统抽样 优点:优点:易于理解,简便易行;抽出的单位在总体中是均匀分布的,且抽取的样本数可少于单纯随机抽样。缺点:缺点:是当总体的观察单位按顺序有周期趋势或单调增(或减)趋势时,容易出现周期性偏差,降低样本的代表性。此外,未使用可能有用的抽样框辅助信息抽取样本,可能导致统计效率偏低。二、概率抽样二、概率抽样分层抽样分层抽样 先将总体全部观察单位按某种特征分为同质的、
12、互不交叉的层(或类型),再从每层(或类型)中独立抽取一定数量的观察单位,将各层次取出的观察单位合在一起组成样本。分层的标准有三种:分层的标准有三种:1.以以调查所要分析和研究的主要变量或与其高度相关的变量作为分层的标准;2.以增加层内的同质性和层间的异质性、突出总体内在结构的变量为分层变量;3.以那些有明显分层区分的变量作为分层变量。二、概率抽样二、概率抽样分层抽样分层抽样各层样本数的确定方法:各层样本数的确定方法:1.分层定比分层定比 即按比例分层抽样,根据各种类型或层次中的单位数目占总体单位数目的比重来抽取子样本的方法。各层的样本数与该层总体数的比值相等。2.奈曼法奈曼法 即各层应抽取的样
13、本数与该层的总体数及其标准差的乘积成正比。3非比例分层抽样非比例分层抽样 非比例抽样又称分层最佳抽样,是根据各层基本单位标准差的大小,来确定各层样本数目的抽样方法。二、概率抽样二、概率抽样分层抽样分层抽样分层抽样的样本量的估算方法:分层抽样的样本量的估算方法:(1)连续型变量总体均数估计的样本量)连续型变量总体均数估计的样本量 当各层的抽样比例相等时:或将总样本量按比例分配到各层,权重为各层的相对大小:NnNniiNNWhiiNNnnWniii二、概率抽样二、概率抽样分层抽样分层抽样(2)01变量总体概率估计的样本量 其中:为相对误差,为概率P的变异系数:PPZn222/)1(PppV)1(二
14、、概率抽样二、概率抽样整群抽样整群抽样 整群抽样是先将调查总体按一定标准划分成若干群或集体,然后以群或集体为单位按随机的原则从总体中抽取若干群或集体,并对抽中群的所有单位都进行调查。“群”的大小有一定的相对性,可以是县、乡、镇、村、区等自然区划,也可以是人为划分的一定人群。划分群时,每群的单位数可以相等,也可以不等,但一般相差不要太大。二、概率抽样二、概率抽样整群抽样整群抽样整群抽样的步骤:整群抽样的步骤:n确定分群的标准;n将总体按确定的标准分为i个互不重叠的群;n根据各样本量,确定应该抽取的群数;n采用单纯随机抽样、系统抽样和分层抽样的方法,从i群中抽取确定数量的个体或单元,并对抽中群的所
15、有单位都进行调查。二、概率抽样二、概率抽样整群抽样整群抽样 优点:优点:简便易行,便于组织,节省费用,容易控制调查质量。缺点:缺点:样本分布比较集中,代表性相对较差。在样本例数一定时,其抽样误差大于单纯随机抽样。二、概率抽样二、概率抽样整群抽样整群抽样整群抽样的样本量的估算方法:整群抽样的样本量的估算方法:可按单纯随机抽样的计算公式来估算样本量。对于均数或总和的估计,变异系数反映的是群与群间的变异性。其中,是以群为单位X的观察值之间的方差,是以群为单位的均数。2xxxxV二、概率抽样二、概率抽样按规模成比例抽样按规模成比例抽样 按规模成比例抽样PPS是一种使用辅助信息,使得每个单位均有按其规模
展开阅读全文