第七章-抽样推断课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第七章-抽样推断课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第七 抽样 推断 课件
- 资源描述:
-
1、一、抽样估计的概念与特点一、抽样估计的概念与特点1.1.抽样估计的概念抽样估计的概念v 抽样估计也叫抽样调查、抽样推断,实抽样估计也叫抽样调查、抽样推断,实际上包括两部分,即抽样调查和抽样推断。际上包括两部分,即抽样调查和抽样推断。即从所研究的对象总体中,按照随机原则抽即从所研究的对象总体中,按照随机原则抽选一部分单位构成一个样本,通过对样本中选一部分单位构成一个样本,通过对样本中所有单位的调查,取得样本资料,根据样本所有单位的调查,取得样本资料,根据样本资料推断总体特征的方法。在该定义中要注资料推断总体特征的方法。在该定义中要注意以下几点:意以下几点:部分与全部。统计抽样调查是以抽选总体里的
2、部部分与全部。统计抽样调查是以抽选总体里的部分单位为调查对象的特征,其部分是来自于总体分单位为调查对象的特征,其部分是来自于总体的并按照一定原则抽取单位。的并按照一定原则抽取单位。随机原则。是指抽样调查在总体中抽取部分单位随机原则。是指抽样调查在总体中抽取部分单位时应遵循的原则,该原则要求在抽取代表单位时,时应遵循的原则,该原则要求在抽取代表单位时,必须随机(非主观)的对待每一单位,使总体中必须随机(非主观)的对待每一单位,使总体中的每一单位被抽取的可能性都相等,即保证各单的每一单位被抽取的可能性都相等,即保证各单位等可能被抽取的原则就是随机原则。位等可能被抽取的原则就是随机原则。部分特征与全
3、部特征的关系。来自总体的部分特征与全部特征的关系。来自总体的部分单位,自然包含了有关总体分布的信部分单位,自然包含了有关总体分布的信息,适当而又有效地利用这些信息,即根息,适当而又有效地利用这些信息,即根据随机得到的部分单位的特征与总体的相据随机得到的部分单位的特征与总体的相应特征的相互关系,才能作出尽可能好的应特征的相互关系,才能作出尽可能好的对总体相应特征的推断。对总体相应特征的推断。对总体的认识。抽样推断的目的是了解和对总体的认识。抽样推断的目的是了解和认识总体全部单位的特征,而非部分单位认识总体全部单位的特征,而非部分单位的特征。所以对部分单位的研究只是一种的特征。所以对部分单位的研究
4、只是一种手段,因为它带有总体相应特征的信息,手段,因为它带有总体相应特征的信息,通过它可以达到认识总体的目的。通过它可以达到认识总体的目的。v2.2.抽样估计的特点与作用抽样估计的特点与作用v(1)(1)部分单位的选择,是依据随机原则抽选的部分单位的选择,是依据随机原则抽选的-随机性随机性。v(2)(2)它是由部分推及全体的方法,即通过对部分现它是由部分推及全体的方法,即通过对部分现象的了解,推断估计全体现象(总体)的各种特象的了解,推断估计全体现象(总体)的各种特征征-推断性推断性。v(3)(3)推断是在一定把握程度下进行的,即推断的可推断是在一定把握程度下进行的,即推断的可能误差是受到有效
5、控制的能误差是受到有效控制的-误差可控性误差可控性。v(4)(4)抽样推断是现代统计学的中心内容,抽样调查抽样推断是现代统计学的中心内容,抽样调查也是现代社会调查的主要的调查方法之一。也是现代社会调查的主要的调查方法之一。v(5)(5)抽样推断的作用不仅是解决了无法进行的全面抽样推断的作用不仅是解决了无法进行的全面调查问题,还可以节省调查成本。还具有省时,调查问题,还可以节省调查成本。还具有省时,省力、登记误差较小等优点。省力、登记误差较小等优点。总体样本 抽样 随机性样本指标总体指标推断误差可控性抽样推断过程抽样推断过程v二、总体和样本v(一)总体v 总体也称为全及总体或母体。是指所要认识的
6、对象全体,它由具有某种共同性质的许多单位所组成。总体的单位数通常都是很大的,甚至是无限的。一般用大写字母N表示总体单位数。v 总体按其中包含的单位数可以分为有限总体和无限总体。v(二)样本v 样本也称为样本总体或子样。它是作为全及总体的一个代表而存在的。样本中也有许多个体,组成样本的单位也称为样本单位。样本中所包含的单位数称为样本容量,通常用n表示。v 样本可分为大样本和小样本。若n30,则称为小样本。否则称为大样本。一般,社会经济现象都是大样本。自然实验多是小样本。v 研究对象一经确定,则总体也就唯一确定了。但作为观察对象的样本就不是这样的。从一个总体中可以抽取很多个样本,每次可能抽到哪个样
7、本不是确定的,也不是唯一的。v三、随机原则和随机性v 随机原则是指在抽样前或抽样过程中,应保证总体中的每个单位都处在平等地位上,即都有相同的被抽中的可能性(概率)。根据这一原则,抽样者要在不带任何主观意愿,并排除一切外来因素干扰的条件下随意地抽取单位组成样本。随机性原则是抽样时必须遵循的原则。v 依据随机原则抽选的样本,我们称其具有随机性。v四、总体指标和样本指标v 样本是总体的代表,所以总体指标和样本指标是一一对应的。总体指标也称为总体参数,是不变的、未知的,也是客观存在的。样本指标也称为样本统计量,通过调查,是可以知道的,但每个样本的样本指标是不完全相同的,也就是说样本指标是一个随机变量。
8、v 假定总体由X1,X2,XN组成。v 样本由x1,x2,xn 组成。总体指标样本指标单位数(容量)Nn平均数标准差比例(成数)比例标准差NXXnxxNXX2)(1)(2nxxSNNNNP011nnnnp011)1(PPP)1(ppSp N1表示总体中具有某种性质的单位数 n1表示样本中具有某种性质的单位数v一、简单随机抽样(纯随机抽样)v 这种抽样方式是对随机原则不加任何限制,直接从总体中抽取样本。我们平时所见的抽签,抓阉,以及各种奖券的摇奖都是这种方式。简单随机抽样有直接抽选法、抽 签 法、随 机 数 表 法 等 三 种 方 法。v 简单随机抽样又分为重复(重置)抽样和不重复(不重置)抽样
9、两种形式。v 重复抽样是指每抽取一个单位后还将其放回到总体中去,再抽取下一个单位。这样保证每次抽取时总体构成不变,而每个个体可能被抽中多次。每次每个个体中选概率为1/N。v 不重复抽样是每次抽中的单位不再放回总体中去,这样每个个体最多只可能被抽中一次。虽然不重复抽样每次抽取之后总体容量和构成都在发生变化,但它仍能保证每个个体中选概率相等。v 简单随机抽样主要适合总体容量不是很大,所观察的特征分布比较均匀的情况。v二、等距抽样(机械抽样、系统抽样)v 将总体单位编号排序(可按时间顺序、空间顺序或其它顺序编号),然后由样本容量和总体容量的比值确定出抽取间距,每隔一(固定的)间距,抽取一个单位。v
10、例:从已有某种顺序(如学号顺序)的 1000人中要抽取50人为样本进行调查,则比值为5%,也就是每20人中抽1人。首先从120号中以简单随机方式抽取一个号码,比如抽中12号,当第一个号码确定后,以后要抽的单位就都确定了,32,52,992。这50个号码所代表的人构成的样本就是等距抽样的一个样本。v 等距抽样是按间距把总体分为若干距离相等的组,当第一组选择的位置确定后,后面各组中所抽的样本单位也就随之确定了,因此,这种抽样方式的随机性远不如简单随机抽样。特别是当总体单位的排列呈现出某种周期性时,采用这种方式会导致样本出现倾向性偏差。所以等距抽样适用于总体容量较大,各单位已有现成编号,且样本单位在
11、总体中分布均匀的情况。v三、类型抽样(分层抽样)v 当总体内部各单位之间性质差异较大时,我们可以将总体按与有关的主要标志划分为若干类,使每一类内性质相近,然后在每一类别中分别抽取单位构成样本。v 例如,要对某行业的100个工厂的劳动生产率作抽样调查(已知劳动生产率与工厂规模有关)。则首先需将总体分为大、中、小厂三种类型。如果已知100个工厂中有6个大厂、20个中厂、74个小厂,现确定样本容量为20,那么各类中样本容量按 比例分配应为:大型厂 6X20/100=1.21(个)中型厂 20X20/100=4(个)小型厂 74X20/100=14.815(个)这就是说应随机地从大厂中抽取1个单位,从
12、中、小型厂中分别抽4个和15个单位。这20个厂组成一个样本。v 类型抽样的前提是对总体有比较充分的了解,且总体内部有比较明显的差异。这时采用类型抽样可得到对总体更具代表性的样本。v四、整群抽样v 整群抽样是将总体分为若干群,并尽量使这些群之间没有明显的类别差异,然后,以群为单位,在这些群中随机地抽取一个或几个群作为样本,样本包括被抽中群中的全部单位。v 假定将总体分为m群,从中抽取k群,则每个个体中选的概率为k/m。v 整群抽样适用于总体容量很大的情况,一般多用于居民家计调查,农产量调查和大量产品的质量检验等等。v五、多阶段抽样v 当总体规模很大时,采用整群抽样的样本容量仍然很大时,可采用多阶
13、段抽样,这时可对所抽中群再进行抽样,从被抽中群中再抽取部分组成样本。这种方法叫两阶段抽样。依此类推,在多次分组的基础上,还可进行多阶段抽样。v 如农产量抽样调查,可以首先抽县,再从选中县中抽选乡,然后再从选中乡中抽选地块实割实测,取得样本产量资料。v一、可能样本与抽样分布v1.可能样本v 可能样本是指总体容量N和样本容量n都确定后,总体中每一个可能被抽中的样本。v 一次抽样的全部可能样本数目,由总体容量N,样本容量n和抽样方式决定。对于一个无限总体,则可能样本数也是无限的。v考虑顺序的可能样本v重复抽样:v不重复抽样:v不考虑顺序的可能样本v重复抽样:v不重复抽样:nNnNPnnNC1nNCv
14、2.样本分布v 样本分布是指由全部可能样本依某一样本指标的变动而形成的次数或比率分布。例如样本平均数的抽样分布(简称样本平均数分布),就是全部样本依各个样本的平均数值归类整理得到的。其他如样本比例分布、样本标准差分布都是如此得到的。v1.样本平均数的平均数(数学期望)等于总体平均数。v2.样本平均数的方差等于总体方差的1/n乘以修正因子。Xx122NnNnxv二、抽样推断的理论依据v1.大数定律(大数法则)v 大数法则证明:如果随机变量总体存在着有限的平均数和方差,则对于充分大的样本单位数n,可以用几乎趋近于的概率,来期望样本平均数与总体平均数的绝对离差为任意小,即对于任意的正数有:v2.中心
15、极限定理1)(XxPLimn 正态分布的性质:(1)以平均数为中心的轴对称分布(2)在平均数的两侧,以分布标准差为单位计算的一定距离内,次数分布的比率是确定的,如在平均数一个标准差距离内,次数分布比率为68.27%。v 实际抽样是从全部可能样本中随机抽取的一个,虽然我们不能肯定这个被抽中的样本的平均值落在哪里,偏离总体平均数有多远?但是我们可以说,它落在 范围内的可能性为68.27%。落在这一范围以外的可能性为31.73%。落在 范围内的可能性为95.45%。落在这一范围以外的可能性为4.55%。xxXXxxXX22v一、抽样误差一、抽样误差v在抽样调查和抽样推断过程中,可能会产生各种在抽样调
展开阅读全文