六章抽样估计课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《六章抽样估计课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样 估计 课件
- 资源描述:
-
1、第六章 抽样估计主要内容n1.抽样估计概述n2.抽样误差n3.抽样估计的方法n4.样本容量的确定选 择 抽 样 框n抽样框就是所有总体单位的集合,抽样框就是所有总体单位的集合,是总体的数据目录或全部总体单位是总体的数据目录或全部总体单位的名单。的名单。n根据抽样框可以根据抽样框可以重新界定总体重新界定总体。如。如抽样框是电话簿,则家庭成员总体抽样框是电话簿,则家庭成员总体可以被重新界定为列入电话簿中的可以被重新界定为列入电话簿中的那部分家庭的成员。那部分家庭的成员。抽 样 框n例例 如:如:要从商学院的全体学生中抽取要从商学院的全体学生中抽取500名学生作为调查样本,则商学院全名学生作为调查样
2、本,则商学院全体在校生的名单就是这次抽样的样本框;体在校生的名单就是这次抽样的样本框;如果是从该校所有班级中抽取部分班级如果是从该校所有班级中抽取部分班级的全体同学作为调查样本,则此时的抽的全体同学作为调查样本,则此时的抽样框就是全校所有班级的名单,因为此样框就是全校所有班级的名单,因为此时的抽样单位已经不再是单个的学生,时的抽样单位已经不再是单个的学生,而是单个的班级。而是单个的班级。n注注 意:意:一般街道居委名录、企一般街道居委名录、企业名录、电话本、花名册、俱业名录、电话本、花名册、俱乐部名录、黄页簿、工商局企乐部名录、黄页簿、工商局企业登记库、行业年鉴等都是市业登记库、行业年鉴等都是
3、市场调查中常用的抽样框。场调查中常用的抽样框。1.抽样估计的概述n概念:概念:n在抽样调查抽样调查的基础上,用样本的实际资料计算样样本指标本指标,并据此估计和推断总体相应数量特征估计和推断总体相应数量特征的一种统计推断方法统计推断方法。n特点:特点:n随机原则抽取;随机原则抽取;n部分部分单位推断总体推断总体;n误差可算可控误差可算可控;n基于概率概率的一种统计推断方法。n理论基础:理论基础:大数法则、中心极限定理n大数法则:大数法则:关于大量的随机现象具有稳定性质的法则。它论证了抽样平均数趋近于总体平均数的趋势,为抽样估计提供了重要的依据。n中心极限定理:中心极限定理:研究变量和分布序列的极
4、限定理。n如果总体变量存在有限的平均数和方差,那么不论这个总体变量分布如何,随着抽样单位数n的增加,抽样平均数的分布将趋近于正态分布。抽样估计中的基本概念n(一)总体和样本n(二)总体指标和样本指标n(三)重复抽样和不重复抽样总体和样本n总体:总体:研究现象的全体,由所研究范围内具有某种相同性质的全体单位相同性质的全体单位所组成的整体。通常用N表示。品质标志品质标志数量标志数量标志总体总体属性总体属性总体变量总体变量总体n样本(子样)样本(子样):从总体中随机抽取出来,代表总体的那部分单位的集合。n样本单位数样本单位数,又称样本容量样本容量,通常用n表示。样本容量如何确定呢?样本容量如何确定呢
5、?一般来讲:一般来讲:当当 n 30n 30,称为,称为大样本大样本;当当 n 30n 30,称为,称为小样本小样本。指样本中含有的总体单位的指样本中含有的总体单位的数目,数目,通常用通常用n 来表示。来表示。样本容量样本容量找出在规定误差找出在规定误差范围内的最小样范围内的最小样本容量本容量找出在限定费用找出在限定费用范围内的最大样范围内的最大样本容量本容量总体指标和样本指标n总体指标:总体指标:根据总体中各单位的标志值或标志属性计算的,反映总体数量特征总体数量特征的综合指标。总体是唯一确定的总体指标的数值也是唯一确定的样本数据(已知)总体指标(未知)抽样估计抽样估计推断和估计统计推断统计推
6、断参参数(未知量)数(未知量)统统计量(已知量)计量(已知量)总体是唯一确定总体是唯一确定 的,样本总体不唯一的,样本总体不唯一注注 意意设总体变量X为:X1,X2,X3,XN,则有:或或miiimiiffXX121或或对于变量总体变量总体,常用的总体指标有总体平均数 、总体标准差 对于属性总体属性总体,最常用的指标是成数成数。总体成数总体成数表示总体中具有某种性质的单位数在总体全部单位数中所占的比重,以P P表示;总体中不具有某种性质的单位数在总体全部单位数中所占的比重则以Q Q表示。设总体N个单位中,有N N1 1个单位具有某种性质,N N0 0个单位不具有某种性质,N1+N0=N,则有:
7、1NPN011NNNQPNN,n样本指标:样本指标:根据样本各单位各单位标志值或标志属性计算的综合指标,也称统计量统计量,它是来估计和推断总体参数估计和推断总体参数的。n与总体指标相对应,有样本平均数样本平均数、样本样本成数成数及样本标准差样本标准差等。设样本变量x x的观察值为:x x1 1,x x2 2,x xn n,则:样本平均数:样本平均数:样本标准差:样本标准差:样本方差:样本方差:样本成数:样本成数:xxnxfxf22()xxSn22()xxfSf2()xxSn2()xxfSf1npn或或或样本成数的标准差:样本成数的标准差:(1)Spp抽出抽出个体个体登记登记特征特征放回放回总体
8、总体继续继续抽取抽取抽出抽出个体个体登记登记特征特征继续继续抽取抽取名 称样 本总 体定义从总体中抽出的部分单位研究对象的全部单位特征统计量参数符号 样本容量 样本平均数 样本比率 样本方差 样本标准差 总体容量 总体平均数 总体比率 总体方差 总体标准差2nxpss2PN1.纯随机抽样(简单随机抽样)纯随机抽样(简单随机抽样)对总体不做任何分类或排序,完全按随机原则抽样。适用范围:适用范围:总体规模不大,内部差异较小。总体规模不大,内部差异较小。例:一个班组有A、B、C、D、E 5个工人,随机抽取2个工人的日工资数作为了解整个班组平均工资水平的样本。可能的结果是 有放回抽样:25个样本不放回
9、抽样:20个样本随机抽样设计样本号ABCDEABCDE2.等距抽样(机械抽样或系统抽样)等距抽样(机械抽样或系统抽样)将总体按某一标志值顺序排列,然后相等距离或相等间隔抽取样本将总体按某一标志值顺序排列,然后相等距离或相等间隔抽取样本单位。单位。间隔距离:间隔距离:N:总体单位数:总体单位数 n:需要抽取的样本单位数:需要抽取的样本单位数 例:从某企业例:从某企业5000名职工中抽取名职工中抽取100人进行家庭收入水平调查。人进行家庭收入水平调查。样本的距离样本的距离=起点的选择:按姓氏排序,在第一个间隔中随机选取。起点的选择:按姓氏排序,在第一个间隔中随机选取。knN排序标志排序标志无关标志
10、无关标志有关标志有关标志501005000 优点:优点:1.能保证被抽取的单位在总体中均匀分布 2.能使抽样过程简化 应用中的注意事项:应用中的注意事项:注意抽样间隔或样本距离和现象本身的节奏性和循环周期相重合的问题 3.类型抽样(分类抽样或分层抽样)类型抽样(分类抽样或分层抽样)先将总体中的所有单位按某个标志分组,然后从各组按纯随机抽样或等先将总体中的所有单位按某个标志分组,然后从各组按纯随机抽样或等距抽样方式抽样。采用这种方法,由于各单位之间的差异因划类或分层距抽样方式抽样。采用这种方法,由于各单位之间的差异因划类或分层而缩小,这就比较容易选出有代表性的样本而缩小,这就比较容易选出有代表性
11、的样本 适用范围:适用范围:总体情况复杂,各类型或层次之间的差异较大而总体容总体情况复杂,各类型或层次之间的差异较大而总体容量又较大。量又较大。优点:优点:比简单纯随机抽样更精确,能以较少的抽样单位数得到较准确的比简单纯随机抽样更精确,能以较少的抽样单位数得到较准确的推断结果。特别是当总体各单位变量值大小悬殊、各组标志变动程度很推断结果。特别是当总体各单位变量值大小悬殊、各组标志变动程度很大时,划分类型能保证各组都有选中的机会。大时,划分类型能保证各组都有选中的机会。类型抽样分类类型抽样分类 类型比例抽样:类型比例抽样:按统一的比例来确定各类型组应抽选的样本单位数,即各类型中抽取的样本单位数
12、占各类型组所有单位数 的比例是相等的,等同于样本单位总数 n 占总体单位数 N 的比例类型适宜抽样:类型适宜抽样:考虑各类型标志变动程度 不同,变动程度大的组要多抽样,变动程度小的类型组可少抽样,使得各类型组的变动程度 在所有类型变动程度之和 中的比例相同,等同于 或NnNnNnNnkk2211i1kiiiNnniNNiiniN1iiikiiinNnNn例:某项粮食播种面积20000亩,其中有平原和山区两种地形。以类型抽样的方法了解平均粮食产量。地形全部面积(Ni)样本面积(ni)平原山区 14000 6000合计 20000总体N比例抽样适宜抽样N1N2N3n1n2n3nNNni1nNNni
13、iii1n类型抽样确定各组样本的方法:类型抽样确定各组样本的方法:4.整群抽样整群抽样 将总体按某个标志分为多个群,按纯随机抽样方式或等距抽样方式,将总体按某个标志分为多个群,按纯随机抽样方式或等距抽样方式,抽取若干群,然后对所抽中的各群中的全部单位一一进行调查。抽取若干群,然后对所抽中的各群中的全部单位一一进行调查。适宜范围:适宜范围:不适合单个抽样的场合,就可采用整群抽样方式。不适合单个抽样的场合,就可采用整群抽样方式。优缺点:优缺点:调查方便,但抽样误差较大。调查方便,但抽样误差较大。例:从某县例:从某县100个村中抽出个村中抽出10个村,进行全面调查,就可以大致了个村,进行全面调查,就
14、可以大致了 解农村家庭副业发展情况。解农村家庭副业发展情况。总群数 R=13C DG K样本数 r=4样本容量n=nc+nd+ng+nkADCFGHIJKLMBE5.多阶段抽样多阶段抽样 总体包含的单位很多,分布很广,要通过一次抽样抽选样本很困总体包含的单位很多,分布很广,要通过一次抽样抽选样本很困难,此时,可以将其分成若干阶段,然后逐阶段进行抽样,以完成难,此时,可以将其分成若干阶段,然后逐阶段进行抽样,以完成整个抽样过程。整个抽样过程。特点:多个阶段、多种方法综合抽样,优点是降低抽样成本。特点:多个阶段、多种方法综合抽样,优点是降低抽样成本。例:对某山区的林采蓄积量作抽样调查。将总体例:对
15、某山区的林采蓄积量作抽样调查。将总体50块面积相等的地块面积相等的地划为划为10个区,每个区包括个区,每个区包括5个地块。采用两阶段抽样,先从个地块。采用两阶段抽样,先从10个区个区选中选中30%,再从选中的区域中抽取,再从选中的区域中抽取60%的地块组成样本进行调查。的地块组成样本进行调查。2.抽样误差n抽样误差地概念n抽样误差的侧度 登登记记误误差差误误差差系系统统性性误误差差代代表表性性误误差差随随机机误误差差样本单位的结构与总体单位结构分布不一致而产生的误差。三种误差的区别:n登记误差:登记误差:由于人的由于人的主观失误主观失误在观察、在观察、登记、计算时造成的误差,可以避免。登记、计
16、算时造成的误差,可以避免。n系统性误差:系统性误差:由于由于有意识有意识选取调查单选取调查单位造成的系统偏差,理论上可以避免。位造成的系统偏差,理论上可以避免。n随机误差:随机误差:由于按照由于按照随机原则随机原则抽取样本抽取样本而产生的误差,无法避免但可以控制。而产生的误差,无法避免但可以控制。抽样误差的侧度n(一)抽样实际误差n(二)抽样平均误差n(三)抽样极限误差抽样实际误差抽样实际误差n 在一次具体的抽样调查中,由随机随机因素因素引起的样本指标与总体指标之间的离差。抽样实际误差抽样实际误差是无法计算的。同时,抽样实际误差仅仅是一系列可能出现的可能出现的误差数值之一误差数值之一,因此,抽
展开阅读全文