第八章-抽样推断课件.ppt

上传人（卖家）：三亚风情

文档编号：3408481

上传时间：2022-08-28

格式：PPT

页数：166

大小：1.90MB

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

29 文币

交易提醒：下载本文档，相应价格的文币将全额进入上传人（卖家）的账号。立即下载优惠套餐（点此详情）

【下载声明】
1. 本站全部试题类文档，若标题没写含答案，则无答案；标题注明含答案的文档，主观题也可能无答案。请谨慎下单，一旦售出，不予退换。
2. 本站全部PPT文档均不含视频和音频，PPT中出现的音频或视频标识（或文字）仅表示流程，实际无音频或视频文件。请谨慎下单，一旦售出，不予退换。
3. 本页资料《第八章-抽样推断课件.ppt》由用户（三亚风情）主动上传，其收益全归该用户。163文库仅提供信息存储空间，仅对该用户上传内容的表现方式做保护处理，对上传内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知163文库（点击联系客服），我们立即给予删除！
4. 请根据预览情况，自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器，压缩文件请下载最新的WinRAR软件解压。

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 第八抽样推断课件

资源描述：: 1、经济管理类专业应用型本科教材统计学电子工业出版社出版主编杜家龙第八章抽样推断教学目的掌握抽样推断的基本原理和常用组织掌握抽样推断的基本原理和常用组织方式，理解抽样推断的基本概念和特点，能方式，理解抽样推断的基本概念和特点，能够选择适当抽样方式、确定必要样本容量、够选择适当抽样方式、确定必要样本容量、组织抽样调查、计算样本指标和抽样误差，组织抽样调查、计算样本指标和抽样误差，熟练、准确地应用样本指标推断总体指标。熟练、准确地应用样本指标推断总体指标。重点难点抽样原理和抽样平均误差的分布规律和计抽样原理和抽样平均误差的分布规律和计算方法。简单随机抽样、类型抽样理论和方算方法。
2、简单随机抽样、类型抽样理论和方法。法。第一节抽样推断基本原理一、抽样推断的概念和特点所谓抽样推断，是指按照随机原则从调查总体中抽取一部分单位组成样本进行统计观察和计算，并根据所得样本指标，在一定把握程度下，对调查总体相应指标作出估计和判断。抽样推断具有以下五个特点：第一，在抽取调查单位时遵循随机原则；第二，在取得调查结果时用部分估计总体；第三，在推断手段上使用概率估计方法；第四，抽样推断误差可以计算和控制；第五，抽样推断以中心极限定理为基础。二、抽样推断的基本范畴抽样推断中常用的基本范畴（或称概念）主要有全及总体与样本总体、全及指标（或称参数）与样本指标（或称统计量）、重复抽样与不重复抽样
3、等。（一）全及总体与样本总体全及总体指所研究现象的整体，即研究对象所有单位组成的总体。全及总体单位数通常是很大的，常用N表示。样本总体，是指在抽样调查中从全及总体中抽取的那部分单位组成的总体。例如上述调查中抽取的100名学生就构成样本总体。样本总体单位数（或称样本容量）常用n表示，上例中n=100。例如，从10000名学生中抽取100人进行生活消费调查，以计算学生月平均生活消费额，则全及总体单位数 N=10000。X2 （二）全及指标与样本指标 1.全及指标（参数）根据全及总体全部单位的数据计算的指标称全及指标（或参数）。全及指标是客观存在的常数，在抽样推断中常用的全用指标主要有全及平均数
4、，全及成数P，全及方差和全及标准差等。NXXX,21或NXXFXFX（1）全及平均数设全及总体某一变量值为则有：（2）全及成数设全及总体N个单位中具有某种属性单位和N1，其余N0个单位不具有该种属性，且有N1+N0=N，则称具某种属性的单位在全及总体中年占比重P为全及成数，即：NNP1NNQ0PQ11QP，令则，或XXNNiix212)(1NiiiNiixFXXF1212)(1或XXNNiix12)(1NiiiNiixFXXF121)(1)1(2PPP)1(PPP （3）总体方差和标准差总体平均数的方差和标准差：总体成数（比率）的方差和标准差：xp2SS .样本指标（统计量）根据样本各
5、单位变量值或品质属性计算的反映样本特征的统计数据称为样本指标或称统计量。与全及指标相对应，样本指标主要有样本平均数，样本成数，又称样本比率或比重，样本方差和样本标准差等。xn,21nxxxniixnx11niiiniifxfx111(1)样本平均数设为样本的某一变量，其n项变量值为则：或n1nnnn01pnnp1nnq0pq11qp(2)样本成数（比率）设样本总体个单位中，具有某种属性的单位有其余个单位不具有该种属性，且则称具有某种属性的单位在样本总体中所占比重为样本成数，即：，令，则：，0n(3)样本方差和标准差样本平均数的方差和标准差：或xxnSniix212)(1nii
6、iniixfxxfS1212)(1或xxnSniix12)(1niiiniixfxxfS121)(1)1(2ppSp)1(ppSp样本成数（比率）的方差和标准差：Nnn （三）重复抽样与不重复抽样 1.重复抽样重复抽样又称有放回抽样或重置抽样。它是从个单位的总体中抽取个单位组成样本，每次从总体中抽取一个单位并登记其有关标志信息后，再放回总体中参加下一次抽取，直至抽取个单位为止。这样总体单位数不变，每次抽取一个单位时总体中的所有单位都有同等被抽中的机会，但是有重复抽取的可能。根据研究目的和研究对象的特点不同，重复抽样又有考虑顺序与不考虑顺序两种情况。NnnN2552 （1）考虑顺序的重复抽
7、样考虑顺序的重复抽样就是可重复排列。一般地，从个不同单位的总体中，随机有放回地抽取个单位组成样本，其全部可能的样本数目为个。如从1、2、3、4、5 五个数字中随机取两个组成两位数，可组成个两位数，它们是：11 12 13 14 15 21 22 23 24 25 31 32 33 34 35 41 42 43 44 45 51 52 53 54 55 Nn（2）不考虑顺序的重复抽样不考虑顺序的重复抽样就是可重复组合。一般地，从个不同单位的总体中，随机有放回地抽取个单位组成样本，其全部可能的样本数目为个。如从A、B、C、D四个字母中随机取两个组成代码，在不考虑顺序（只要元素相同就
8、认为是同一个样本）的情况下可组成个代码，它们是：AA AB AC AD BB BC BD CC CD DD)!1(!)!1(1NnnNCnnN10)!14(!2)!124(2124CNnn 2.不重复抽样不重复抽样又称无放回抽样或不重置抽样。它是从个不同单位的总体中随机抽取个单位组成样本，每次从总体中抽取一个单位，连续次抽取构成一个样本。但每次抽取一个单位登记其有关标志信息后，不再放回总体中参加下一次抽取，每个单位只有一次被抽选的机会，因而不会出现重复抽取的情况。不重复抽样也有考虑顺序与不考虑顺序两种情况。Nn（1）考虑顺序的不重复抽样考虑顺序的不重复抽样就是不重复排列。一般地，从
9、个不同单位的总体中，随机无放回地抽取个单位组成样本，其全部可能的样本有个，如从A、B、C、D四个字母中随机不重复抽取两个组成代码，可组成的没有重复字母的代码共有12个，即：，这些代码是：AB AC AD BA BC BD CA CB CD DA DB DC)!(!nNNAnN12)!24(!424ANn)!(!/!nNnNCnN6)!24(!2/!424C （2）不考虑顺序的不重复抽样不考虑顺序的不重复抽样就是不重复组合。一般地，从个不同单位的总体中，随机无放回地抽取个单位组成样本，其全部可能的样本数目为个。如从A、B、C、D四个字母中随机不重复抽取两个组成代码，可组成的没有重复且
10、字母不同的代码为个，它们是：AB AC AD BC BD CD三、抽样推断的数理基础（一）大数定理大数定理，就是关于大量随机现象具有稳定性质的定理。它表明，如果被研究总体由大量相互独立的随机因素构成，而且每个因素对总体的影响都相对地小，那么，由于综合平衡的结果，因素的个别影响将相互抵消，从而显现出它们共同作用的倾向，使总体具有稳定的性质。n1limXxPniixXn 大数定理表明：如果随机变量总体存在有限的平均数和方差，则对于充分大的抽样单位数，可以几乎趋近于的概率期望抽样平均数与总体平均数的绝对离差为任意小，即对任意小的正数有：式中：为样本平均数；为总体平均数；为抽样单位数（样本容
11、量）。)()(tXPtF)(xftdxxftF)()(（二）正态分布 1.正态分布的概念当我们研究的变量是连续变量时，无法将变量值一一列出来表示它们的概率分布，而事实上在这种情况下，每一点的概率都接近于0，求某一点的概率意义不大。通常我们去求变量落在某一区间的概率，用分布函数来描述概率分布情况，通过一个函数把它表示成积分的形式：)(xfx)(tF),(t 函数称为密度函数，它表示随机变量在点概率密度，在图形上则表示为各点概率大小的曲线，表示在区间上所围成的面积，用它来反映落在这一区间内的概率，如图6-1所示。x图6-1 正态分布曲线图)(xfxx2.正态分布密度函数222)(2
12、1)(xxexf式中：为随机变量；e为自然对数的底数；e=2.718281828；为圆周率；=3.141592654；为的平均数；为变量的标准差；和是决定密度函数的两个参数。xx)(xf),(xx)(xfx)(xfx)(xfx)(xfx 3.关于密度函数的两个参数平均数和标准差对密度函数来说，是两个重要参数，当和确定了，也就确定了，并且平均数和标准差对密度函数的影响是不同的。（1）平均数对密度函数的影响平均数的变动不改变正态分布的形状，只改变正态分布的中心位置，如图6-2所示。图6-2当平均数时，密度函数的频率线以轴为对称轴两边对称展开；当平均数时，密度函数
13、的频率线向右平移a个单位；当平均数时，密度函数的频率线向右平移a个单位。0 xaxax oyoy)(xf （2）标准差对密度函数的影响标准差的变动不改变正态分布的中心位置，只改变分布曲线的“胖”、“瘦”、“高”、“矮”程度，如图6-3。图6-3 当时，把密度函数的分布称为标准正态分布；当时，分布曲线变“瘦”，中心高度则增长一倍，表示变量分布比较集中；当时，分布曲线变“胖”，中心高度则缩短一半，表示变量分布比较分散。1,0 x5.024.正态分布密度函数的几个特点（1）对称性，即密度函数的频率曲线以为中心，两边完全对称向左向右延伸。（2）非负性，即在上方。（3）当时，密度
14、函数为最大值。（4）当时，此处是密度函数的拐点，即离平均数左方一个处频率曲线趋势由凹向变为凸向，然后到了平均数右方一个处，频率曲线趋势又恢复为凹向。（5）当时，密度函数，频率曲线向两边下垂，以轴为渐近线伸向无穷处。)(xfxxoxxx21)(xfxxxxx0)(xfox)(xf)(xF5.变量落在某一区间的概率有了概率分布的密度函数，就可以利用不定积分的形式，来表达分布函数，并计算变量落在某一区间的概率。正态分布的分布函数为：txxtdxedxxfxF222)(21)()(它表示变量落在的概率，它是由密度函数与轴在区间所围成的面积，如图8-1所示。x),(t)(
15、xfox),(tx),(ba)(xfox),(ba 我们可以利用两个积分的差数来表示变量落在区间内的概率，如图6-4(a)密度函数与轴在区间所围成的阴影面积所示。)()()(aFbFbxaPaxxbxxdxedxe22222)(2)(21baxxdxe222)(21xx同样，也可以利用分布函数来求变量与值之差的绝对值不超过某数a的概率。即：axaxxxdxeaxxP222)(21)(axxxxdxe222)(22图6-4（b）图6-4（a）如图6-4（b），密度函数与轴在区间所围成的阴影面积。)(xfox),(axax)1,0(xtxxt 6.正态分布的应用由于利用正态分
16、布函数求一定区间的定积分值很复杂，因而人们通常是利用已编制的标准正态分布表去求正态概率值。实践中，我们通常需要首先将非标准正态分布加以标准化，使其变为平均数等于，标准差等于的标准正态分布。为此，引进新变量，并令，则：0)()(xxxxExxEtE222)(xxExxEttEt2222)(0 xxExxExxE 1220,1t所以，标准正态分布的密度函数为：2221)(tetf标准正态分布分布函数为：dtetFtt2221)(0 xxx标准正态分布变换的意义是将频率曲线的中心移至原点，使，并将的绝对离差化为以为单位表示的相对离差。)(tFx),(axax利用标准正态分布函数，我们可
17、以计算变量落在区间之间的概率。其步骤如下：第一，将原给定的变量标准化，即将原变量变换成新的标准变量，；t ttxxt 第二，将原来的定积分区间变换成相应的新区间：),(axaxxaxxax)(,)(即aa,x),(axaxtaa,也就是所求的落在的概率等价于落在区间的概率，从而有如下关系：aFatPaxxP)(at)(tF40600 xxxt 第三，从标准正态分布概率表中找出对应的就是我们所求的概率。例8.1 已知某地小麦亩产量服从正态分布，平均亩产为600公斤，标准差为40公斤，求亩产在580626公斤之间的麦地所占比例。解：根据正态分布标准化要求，令：x),(axax2
18、6600626at根据题意要求落在区间的概率，这里公斤，所以新变量的区间相应为：)65.0,65.0(4026,4026,aa当65.0t，查概率表得：4026)26600()626580(FxPxP4843.0)65.0(F即有48.43%的麦地亩产量在580626公斤之间。6.1585172180 xxt8904.06.1)8172()180170(FxPxP 例6.2 某服装厂经调查得知市场某种男装需求量为50000件，消费者平均身高为172cm,身高标准差为5cm，问身高在170180cm之间的服装应制作多少套？解：根据正态分布标准化要求应有：查概率表得：身高在170180cm
19、之间的服装应制作：500000.8904=44520（套）)(tF表6.1 常用t值和对应的概率F(t)1.001.501.651.962.002.503.000.6827 0.8664 0.90110.9500 0.9545 0.9876 0.9973t （三）中心极限定理中心极限定理是阐述随机变量的极限分布是正态分布的一系列理论的总称。一般地，如果一个随机变量是由大量相互独立的随机因素的影响所造成，而每个因素的作用又是很微小的，那么这一随机变量趋于正态分布。中心极限定理告诉我们：30nXxE)(第一，如果总体很大且服从正态分布，则样本平均数的分布也服从正态分布。第二，如果总体很大但不服从
20、正态分布，只要样本足够大（样本容量），样本平均数的分布也趋近于正态分布。第三，样本平均数的平均数等于总体平均数，即。第四，样本分布的标准差等于总体标准差的，即（式中为样本标准差，为总体标准差，为样本容量）。n1nSxxSn 例6.3 某高校分析新生体检结果资料，得到其中某项指标的均值为10，标准差为4，从该批参加体检的新生中随机抽取35人作为样本，试计算：（1）样本均值大于11的概率；（2）样本均值小于10.5的概率；（3）样本均值在11和10.5之间的概率。10X02.1354nS)02.1,10(2NX 解：因为与人体有关很多变量都服从正态分布，样本容量为35属于大样本，由中心极
21、限定理可知它的分布近似于平均数、标准差的正态分布，即 98.002.11002.1101102.110)11()1(XPXPXP1635.0)98.0(1)98.0(1)98.0(tPtP49.002.11002.1105.1002.110)5.10()2(XPXPXP6879.0)49.0()49.0(tP02.1101102.11002.1105.10)115.10()3(XPXP98.002.11049.0XP1486.06879.08365.0)49.0()98.0(附正态概率表：第二节抽样误差一、抽样误差的概念及影响因素（一）抽样误差的概念抽样推断不可避免产生误差。抽样误差
22、就是抽样估计值与被估计的总体指标之差。抽样误差可分为登记性误差和代表性误差两大类。登记性误差是指在调查过程中由于登记上的差错所造成的误差。代表性误差是指由于样本不足以代表总体特征而产生的误差。代表性误差的产生也有两种情况：一是由于违反随机抽样原则而造成的偏差,称系统性偏误。系统性误差与登记性误差是抽样组织工作的问题，可以采取措施预防或减少它。二是在遵循随机原则的情况下，由于被选择的样本内部各单位被研究标志的构成比例和总体不可能完全一致而形成的随机性误差。该种误差在抽样推断中是无法消除的，抽样推断理论所研究的抽样误差，主要是这种误差。（二）影响抽样误差的主要因素影响抽样误差大小的因素，主要有以
23、下四种：第一，总体变量差异程度的大小。在其他条件不变的情况下，总体变量离散程度（或）越大，抽样误差（或）越大，反之则抽样误差越小；第二，样本单位数（样本容量）的多少。在其他条件不变的情况下，样本单位数越小，抽样误差（或）越大，反之则抽样误差越小。如果样本单位数多到接近总体单位数时，抽样误差就会缩小到几乎没有的程度。xpxpnxp 第三，抽样方法。抽样方法有重复抽样和不重复抽样两种，一般来说，重复抽样的抽样误差要大于不重复抽样的抽样误差。第四，抽样组织方式。在样本容量和抽样方法相同的条件下，不同抽样组织会产生不同的抽样误差。一般来说，简单随机抽样、整群抽样误差较大，类型抽样、等距抽样等抽
24、样组织方式下，抽样误差要小一些。二、抽样平均误差（一）抽样平均误差的概念抽样平均误差就是样本平均数（样本成数）的标准差，它可反映样本平均数（样本成数）与总体平均数（总体成数）的平均误差。由于样本是按随机原则抽取的，从一个总体可以抽取许多同样单位数的样本，每个样本都有自己的样本平均数和成数，一系列的样本平均数（样本成数）就可以计算样本平均数（样本成数）的平均数和标准差。又因为样本平均数（样本成数）的平均数就等于总体平均数（总体成数），因而样本平均数（样本成数）的标准差实际上就反映了样本平均数（样本成数）与总体平均数（总体成数）的平均误差。（二）抽样平均误差的计算 1.样本平均数抽样平均误差的
25、计算（1）重复抽样下，样本平均数抽样平均误差计算nnnx2 若设样本平均数的抽样平均误差为，总体标准差为，样本容量为，则样本平均数的抽样平均误差为：x 例6.4 某组5名学生的体重依次为50、52、54、56、58千克，现随机从中抽出2名计算平均体重，可组成的全部样本为个，样本组合及平均数如表6-2所示，根据样本组合及样本平均数，我们可编制如下频数及频率分布表：2552样本均值505152535455565758合计频数12345432125频率0.040.080.120.160.200.160.120.080.041.00 xfff/表6.3 样本平均数分布表根据样本平均数分布
26、数据，我们可计算样本平均数的平均数、方差和标准差如下：表6.4 重复抽样下样本平均数和方差计算表5051525354555657581234543215010215621227022016811458-4-3-2-10123416941014916161812404121816合计251350-100 xffx)(xx2)(xx fxx2)(样本平均数的平均数等于：样本平均数的方差为：54251350ff xx425100)(2ffxx样本平均数的标准差即抽样平均误差为：225100)(2ffxx 为验证总体标准差与抽样平均误差（即全部可能样本平均数的标准差）的关系，下面我们再计算总体平均数和
27、总体标准差。总体平均数为：5455856545250NXX总体方差为：85405)5458()5456()5454()5452()5450()(2222222Nxxx 验证如下：样本平均数的平均数等于总体平均数：54 Xx抽样平均误差（即样本平均数的标准差）等于总体标准差的：n1242825100)(22nnffxxxxx （2）不重复抽样下样本平均数的抽样平均误差的计算前述中心极限定理已经证明，随机不重复抽样下，抽样平均数的平均误差计算公式如下：或NnNnx12Nnnx12 仍用上述学生体重抽样调查资料，在不重复抽样下，全部可能的样本平均数及其分布如下：表6.5 学生体重不重复抽样样本平
28、均数表样本变量 50 52 54 56 585052545658-51 52 53 5451 -53 54 5552 53 -55 5653 54 55 -5754 55 56 57 -表6.6 不重复抽样样本平均数分布表xfff/样本均值51525354555657合计频数224442220频率0.100.100.200.200.200.100.101.00表6.7 不重复抽样下样本平均数和方差计算表xffx)(xx2)(xx fxx2)(515253545556572244422102104212216220112114-3-2-101239410149188404818合计201080-
29、60不重复抽样样本平均数的平均数为：54201080ff xx不重复抽样样本平均数的方差为：32060)(2ffxx不重复抽样样本平均数的标准差为：732.132060)(2ffxx验证：54 Xx732.1315252812060)(22NnNnffxxxx2x)1(PP 2.样本成数抽样平均误差的计算计算成数抽样平均误差时，将平均数抽样平均误差计算公式中的总体平均数方差换成即可。（1）重复抽样下样本成数抽样平均误差的计算nPPp)1(（2）不重复抽样下样本成数抽样平均误差的计算或NnNnPPp1)1(NnnPPp1)1(2x)1(PP 上述公式中的和是总体指标，在抽样推断中往往是
30、未知的，通常以样本指标代替或采用以前已有的总体指标。5x5.0 xS 例6.5 某市对400000户居民按1%的比例抽样调查平均年收入。测得结果为：样本平均数万元，样本标准差万元；在样本中有400户居民年收入低于2万元。试求重复抽样与不重复抽样下，样本平均数和样本成数的抽样平均误差。解：已知5x5.0 xS400000N4000%1400000n%104000/400p将这些数据代入抽样平均误差计算公式应有：重复抽样下样本平均数抽样平均误差：00791.040005.0nSnxxx不重复抽样下样本平均数抽样平均误差：00787.0399999396000400025.01400000400
31、040000040005.011222NnNnSNnNnxxx%474.000474.04000%)101%(10)1()1(nppnPPp%472.000472.0399999396000400009.0140000040004000004000%)101%(101)1(1)1(NnNnppNnNnPPp重复抽样下样本成数抽样平均误差：不重复抽样下样本成数抽样平均误差：t)(tFttt 三、抽样极限误差抽样极限误差又称抽样允许误差，它是在抽样推断中所允许的样本指标与全及指标之间的最大误差范围。由于正态分布理论已证明，样本指标与总体指标的离差不超过若干（常用表示）倍抽样平均误差的概率（），
32、因此，在抽样推断中常用若干（倍）抽样平均误差来表示极限误差。若设为极限误差，则有：即极限误差是倍的抽样平均误差。倍的抽样平均误差。因此，样本平均数的极限误差可表示为：nttxxx2NnntNnNnttxxxx1122或nPPttpp)1(NnnPPtNnNnPPttpp1)1(1)1(或重复抽样下：不重复抽样下：样本成数的极限误差可表示为：不重复抽样下：重复抽样下：例6.6 从15000名在校大学生中，按照随机原则抽取150名调查月生活消费水平。测得150名学生月平均生活消费额350元，其标准差为30元，月生活消费在300元以下的学生比率为12%。试求在95.45%的概率保证下，抽样平均数
33、和抽样成数的极限误差。350 x30 xS15000N150n%12p9545.0)(tF2t解：已知，将这些数据代入抽样极限误差计算公式应有：90.4150302222nStnttxxxx87.41150001501500015030211222NnNnStNnNnttxxxx样本平均数的极限误差：重复抽样下：不重复抽样下：样本成数的极限误差：重复抽样下：%31.50531.0150)12.01(12.02)1()1(npptnPPttpp不重复抽样下：%28.50528.01150001501500015088.012.021)1(1)1(NnNnpptNnNnPPttpp第三节抽样估计
34、和推断一、抽样估计的概念和特点（一）抽样估计的概念抽样估计或称参数估计，就是以样本的实际资料为依据，计算一定的样本指标，并用以对总体的相应指标作出估计和判断。（二）抽样估计的特点：1.在逻辑上抽样推断应用的是归纳推理。2.在方法上应用不确定的概率估计，而不应用确定的数学分析。3.抽样推断结论存在一定的误差。二、抽样估计的优良标准用样本指标估计总体指标，若满足无偏性、有效性和一致性要求，就认为是一个优良估计。（一）无偏性无偏性就是要求样本指标的平均数等于被估计的总体指标。（二）一致性即当样本容量充分大时，样本指标也充分靠近总体指标。（三）有效性有效性就是要求用样本指标估计总体指标，方
35、差比其他任何估计量方差都小。三、抽样估计方法抽样估计通常有点估计和区间估计两种方法。（一）点估计点估计又称定值估计，就是直接用样本指标作为相应的总体指标的估计量。或者说，就是直接用样本指标代替全及总体相应指标。统计中常用的点估计主要有：xXpP2S2S 1.用样本平均数估计全及总体平均数，即用代替；2.用样本成数估计全及总体成数，即用代替；3.用样本方差估计全及总体方差，即用代替；4.用样本标准差估计全及总体标准差，即用代替。（二）区间估计 1.区间估计的概念区间估计就是在一定概率保证下，用样本指标和抽样平均误差去推断总体指标可能范围的估计方法。区间估计的结果是总体指标可
36、能落在的数值范围或称数值区间及落在该区间的可靠程度（即概率）。我们称这一区间为置信区间，其两端点数值称为置信上限和置信下限。一般地，可靠程度（概率）应当在90%至96%。2.区间估计的步骤对总体指标的区间估计主要有以下几个步骤：（1）抽取样本，计算样本指标；（2）根据给定的概率和已计算的抽样平均误差，确定概率度，计算抽样极限误差；（3）根据已计算的样本指标和抽样平均误差推断总体指标所在区间。例6.8 某电子元件厂对10000只电子元件按随机原则抽取100只进行质量检验，样本调查资料如下表所示。试以95%的概率保证程度，估计这10000只电子元件的平均耐用时间和合格率（耐用时间达到1000小时
37、的为合格品）。ixifiifxxxiiifxx2)(表6.8 某电子元件抽样调查资料计算表耐用时间（小时）组中值检测元件数1000以下1000110011001200120013001300以上95010501150125013505106022347501050069000275004050-208-108-8921922163201166403840186208110592合计-100115800-633600115810011580011niiniiiffxx60.79100633600)(112niiniiixffxxS 解：（1）估计该批元件平均耐用时间计算样本平均耐用时间计算样本
38、平均耐用时间标准差（小时）（小时）92.7110000100100001006.7912NnNnSxx9500.0)(tF96.1t92.7x52.1592.796.1xxt计算平均数抽样平均误差（不重复抽样）计算平均数抽样极限误差，则（小时）（小时）52.117352.151158xx48.114252.151158xx估计该批电子元件平均耐用时间所在区间区间上限：区间下限：即该批电子元件平均耐用时间在1142.48至1173.52小时之间，其可靠程度为95%。95.0100)5100(p2179.0)95.01(95.0)1(ppSp0217.011000010010000100)95.0
39、1(95.01)1(NnNnppp（2）估计该批元件的合格率计算样本合格率计算样本合格率标准差计算样本合格率抽样平均误差（不重复抽样）9500.0)(tF96.1t0217.0p9925.00425.095.0pp9075.00425.095.0pp计算样本合格率极限误差，则区间下限：即该批电子元件合格率在90.75%至99.25%之间，其可靠程度为95%。估计该批电子元件合格率所在区间区间上限：0425.00217.096.1ppt （三）全及总体总量指标的修正与推算在抽样推断实践中，估计全及总体总量指标常用直接推算法和修正系数法。1.直接推算法直接推算法指依据点估计值或区间估计值及全及
40、总体单位数，去推算全及总体总量指标值或全及总体总量指标所在区间。QNxQ 35010000350 NxQ（1）用样本平均数和总体单位数推算总体标志总量。例6.9 某学院在校学生10000人，抽取100名学生作为样本进行调查，测得学生月平均生活消费额350元，试估计该学院全体学生月生活消费额。解：全院学生月生活消费额：（万元）。1NpNN 145509.01 pNN （2）用样本成数和总体单位数推算全及总体中具有某种标志的单位数。例6.10 某班有50名学生，随机抽取10%进行调查，测得及格率为90%，试推算全班及格人数。解：该班及格人数为：（人）。xxN)(,)(NxNxQxx（3）用样本平
41、均数，抽样极限误差和总体单位数，推算总体标志总量所在区间：例6.11 某市有10万名职工，随机抽取1%进行调查，测得职工年平均收入3.5万元，在95.45%的概率保证下抽样极限误差为0.2万元。试推算该市职工年收入总额所在区间。解：该市职工年收入总额所在区间为：)37,33(10)2.05.3(,10)2.05.3()(,)(NxNxQxx即该市职工年收入总额在33至37万元之间，其概率保证程度为95.45%。pN)(,)(1NpNpNpp（4）用样本成数，成数抽样极限误差和总体单位数，推算总体中具有某种标志的单位数所在区间。例6.12 某市有10万名职工，随机抽取1%进行调查，测
42、得职工年平均收入在3万元以下的有40%，在95%的概率保证下抽样极限误差为2%。试推算该市年收入在3万元以下的职工人数所在区间。p 解：该市年收入在3万元以下的职工人数所在区间为：即该市年收入在3万元以下的职工人数所在区间是3.8至4.2万人，其概率保证程度为95%。)2.4,8.3(10)02.040.0(,10)02.040.0()(,)(1NpNpNpp第四节抽样方案设计为了科学有序地开展抽样调查和推断，必须事先设计出符合调查对象特点和调查目的要求的抽样调查方案。设计抽样调查方案要解决的基本问题主要有抽样调查程序、抽样调查单位数和抽样组织方式等。一、抽样调查程序（一）立项。即确定调
43、查的目的、任务，拟定调查项目，规定调查时间和期限。（二）搜集调查总体有关资料，编制抽样框。（三）设计抽样方案。即在保证遵循随机原则，并注意费用尽可能节约的前提下，选择恰当的抽样方式，确定必要抽样单位数。（四）组织样本单位数据搜集和处理。（五）推断总体，提供调查结果及相关说明。二、必要样本容量的确定（一）影响样本容量的主要因素抽样推断方案设计的一个重要任务，就是确定样本容量。而样本容量的大小，受多种因素影响，概括来说，主要有以下几个方面：第一，被研究总体标志变动程度，即总体标准差的值。在其它条件不变的情况下，的值愈大，必要样本单位数愈多；的值愈小，必要样本单位数愈少。t 第二，极限误差（
44、即允许误差）的值。在其它条件不变的情况下，的值大，可以少抽些样本单位；的值小，则要多抽一些样本单位。一般地，的值是在调查之前根据调查目的规定的。第三，概率度的值。在其它条件不变的情况下，值愈大，要求把握程度愈高，则要多抽一些样本单位；值愈小，要求把握程度愈低，则可以少抽些样本单位。tt 第四，抽样方法。在相同条件下，重复抽样需要多抽一些单位，不重复抽样可以少抽一些单位。第五，抽样组织方式。由于不同抽样方式下抽样误差是不同的，为了满足抽样推断的目的要求，不同抽样组织方式必要的样本单位数也是不一样的。一般地，简单随机抽样、整群抽样误差要大一些，因而应当多抽一些单位；类型抽样（分层抽样）、机械抽样
45、（等距抽样）误差要小一些，可以少抽一些单位。（二）必要样本容量的计算抽样推断的组织方式主要有简单随机抽样、类型抽样、机械抽样、整群抽样、多阶段抽样等，下面我们分别介绍各种抽样方式下必要样本容量的计算方法。1.简单随机抽样必要样本容量的计算（1）简单随机重复抽样必要样本容量的计算222xxtn22)1(ppPPtn 例6.13 对某地居民进行人均年收入抽样调查，已知该地人均年收入标准差为8千元，若允许误差不超过1.2千元，概率保证程度为95%，问应抽取多少户居民作为样本；若已知该地居民人均年收入达到30千元的户占85%，成数抽样误差不超过5%，概率保证程度仍为95%，问应抽多少户居民进行调查
46、。解：（1）计算样本平均数必要样本容量已知，则。样本平均数必要样本容量为：82.1x95.0)(tF96.1t1712.1896.1222222xxtn （户）。85.0P05.0p95.0)(tF96.1t19605.0)85.01(85.096.1)1(2222ppPPtn（2）计算样本成数必要样本容量已知，则。，样本成数必要样本容量：（户）。（2）简单随机不重复抽样必要样本容量的计算22222tNNtnxx)1()1(222PPtNPPNtnxp例6.14 某地进行农村经济调查，已知农户平均收入标准差（）为500元，农户总数10000户，要求把握程度为95%，允许误差为50元。
47、问不重复抽样下应抽多少农户进行调查。xS96.1,95.0)(,50,500,10000ttFSNxx则37050096.1501000050096.110000222222222222222xxxxxStNSNttNNtn解：已知：所以即应抽370户进行调查。例6.15 某灯具厂欲对10000只灯管进行耐用时间检验，以往几次合格（耐用时间达到1000小时为合格品）率检验结果为90%、94%和96%。如果允许误差不超过3%，可靠程度为95.45%，问不重复抽样下应抽多少只灯管进行检验？解：已知:10000,2,9545.0)(,03.0,9.0NttFPp则所以3851.09.0203.010
48、0001.09.0210000)1()1(222222PPtNPPNtnxp即应抽385只灯管进行检验。三、抽样调查的组织方式在进行抽样调查工作时，必须根据研究总体本身的特点和抽样调查的目的要求，对抽取样本的程序和方式进行周密的设计和安排，这些工作概括来说，称为抽样调查组织方式。在抽样调查实践常用的组织方式概括起来，主要有五种，即简单随机抽样、类型抽样（又称分层抽样）、等距抽样（又称机械抽样）、整群抽样和多阶段抽样。Nn （一）简单随机抽样 1.简单随机抽样的概念、适用条件和不足简单随机抽样，又称纯随机抽样，它是按照随机原则直接从全及总体个单位中抽取个单位作为样本进行调查的组织方式。简
49、单随机抽样只适用于均匀总体，且各单位之间被研究标志值的差异较小，总体单位数较少，且便于编号和抽取。简单随机抽样的不足是没有充分利用全及总体已知信息或辅助资料；在总体单位很多，编号困难甚至不可能时，无法组织抽样；有时抽到的单位很分散，致使调查工作十分困难。2.简单随机抽样下的取样方法主要有直接抽选法、抽签法和随机数表法等。（1）直接抽选法。即直接从全及总体中随机抽取样本单位的方法。如从粮食仓库中不同地点取出若干袋粮食进行质量检验等。（2）抽签法。即先给每个总体单位编号，然后在遵循随机原则的前提下，采用一定方法抽取号码，确定中选单位。（3）随机数表法。随机数表上数字的出现及其排列是随机形式的，从
50、0到 9共10个数字，每个数字各占1/10。而且表上数字组成的多位数（两位数、三位数、四位数、五位数等）也有大体相同的出现机会。使用时从表中任一行任一列开始，按照事先设定的样本单位数目的位数，依次抽取数字，直到取够预定单位数为止。例6.16 某茶叶经销公司利用抽样推断方法检测一批包装茶叶是否符合重量要求，规定每包重量不低于152克。随机抽取100包，检测结果如表6.9所示，试以95.45%的概率估计该批茶叶平均每包重量。fxxfxx2)(xxfxx2)(表6.9 某公司茶叶重量检测数据表每包重量包数组中值（克）148-1505149745-41680150-152201513020-24801

展开阅读全文

163文库所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：第八章-抽样推断课件.ppt
链接地址：https://www.163wenku.com/p-3408481.html

三亚风情

内容提供者

实名认证

联系作者