第5章抽样调查34课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第5章抽样调查34课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样调查 34 课件
- 资源描述:
-
1、.第三节第三节 抽样误差与参数估计抽样误差与参数估计一、抽样误差的概念一、抽样误差的概念 二、抽样平均误差二、抽样平均误差 三、抽样极限误差三、抽样极限误差 四、抽样估计的概率度和置信度四、抽样估计的概率度和置信度 五、参数估计方法五、参数估计方法 六、样本容量的确定六、样本容量的确定2022-10-4一、抽样误差的概念一、抽样误差的概念 (一)抽样调查误差的种类(一)抽样调查误差的种类 (二)抽样误差的概念(二)抽样误差的概念 (三)抽样实际误差(三)抽样实际误差 (四)抽样平均误差的概念(四)抽样平均误差的概念2022-10-4(一)抽样调查误差的种类(一)抽样调查误差的种类抽样调查误差抽
2、样调查误差登记性误差登记性误差代表性误差代表性误差随机误差随机误差系统误差系统误差(可以计算)(可以计算)抽样误差抽样误差(随机误差)(随机误差)抽样实际误差抽样实际误差 .抽样平均误差抽样平均误差 (无法计算)(无法计算)10/4/2022 抽样误差的性质:抽样误差的性质:1、随机误差:样本产生的随机性、随机误差:样本产生的随机性 2、代表性误差:、代表性误差:样本结构样本结构不足以代表不足以代表总体结构总体结构 xXxPPp(二)抽样误差(二)抽样误差抽样误差概念:抽样误差(随机误差)是指由于抽样误差概念:抽样误差(随机误差)是指由于抽样的随机性而产生的样本指标与总体指标之间抽样的随机性而
3、产生的样本指标与总体指标之间的离差。的离差。抽样误差表达形式:抽样误差表达形式:10/4/2022 即是指每次抽样调查所得的即是指每次抽样调查所得的样本指标样本指标与与总体指标总体指标之间的之间的离差离差。抽样实际误差抽样实际误差 :它随着样本的不同而不同,是一个随机变量。它随着样本的不同而不同,是一个随机变量。(三)抽样实际误差(三)抽样实际误差它无法计算。它无法计算。2022-10-4 即是指所有可能出现的样本即是指所有可能出现的样本指标与总体指标之间的平均离差,即所有指标与总体指标之间的平均离差,即所有可能出现的样本指标与总体指标的标准差。可能出现的样本指标与总体指标的标准差。抽样平均误
4、差抽样平均误差 :对于一个特定的总体来说,抽样平均误差可对于一个特定的总体来说,抽样平均误差可以根据数理统计方法在调查之前计算出来,还以根据数理统计方法在调查之前计算出来,还可以通过设计调查方案控制其大小。可以通过设计调查方案控制其大小。(四)抽样平均误差的概念(四)抽样平均误差的概念2022-10-4 (一)抽样平均误差的定义公式(一)抽样平均误差的定义公式 (二)抽样平均误差的应用公式(二)抽样平均误差的应用公式 (三)影响抽样(平均)误差大小的因素(三)影响抽样(平均)误差大小的因素二、抽样平均误差二、抽样平均误差2022-10-4MPpp2)(M:全部可能的样本个数全部可能的样本个数M
5、Xxx2)(1.1.样本平均数的抽样平均误差样本平均数的抽样平均误差 2.2.样本成数的抽样平均误差样本成数的抽样平均误差 MXxpp2)((一)(一)抽样平均误差的定义公式抽样平均误差的定义公式2022-10-4平均误差的定义公式只能用来解释平均误差的概念,在平均误差的定义公式只能用来解释平均误差的概念,在实际问题中无法应用。因为:实际问题中无法应用。因为:首先,总体的平均数或成数通常未知;首先,总体的平均数或成数通常未知;其次,也很难给出全部样本的平均数或成数。其次,也很难给出全部样本的平均数或成数。在实际工作中,用根据数理统计理论证明推导出来的公式。在实际工作中,用根据数理统计理论证明推
6、导出来的公式。2022-10-4(1 1)重复抽样:)重复抽样:nnx2总总体体标标准准差差:样样本本容容量量:n(2 2)不重复抽样:)不重复抽样:1NnNnx2Nnn1总总体体单单位位数数:N注意:注意:在实际计算在实际计算抽样平均误差抽样平均误差时,当时,当总体标准差总体标准差未知未知时,可以用时,可以用样本标准差样本标准差s来代替。即:来代替。即:nxxs2)(nx1)(nxxs2ns(大样本)(大样本)(小样本)(小样本)1.1.样本平均数的抽样平均误差样本平均数的抽样平均误差(二)(二)抽样平均误差的应用公式抽样平均误差的应用公式2022-10-4 例:例:现有现有A、B、C、D四
7、个四个工人构成的总体,他们所生产某种产工人构成的总体,他们所生产某种产品的日产量分别为品的日产量分别为2222、2424、2626、2828件,若按重复抽样方法,从工人件,若按重复抽样方法,从工人总体中随机抽取两个工人组成一个样本,用其样本平均日产量来估总体中随机抽取两个工人组成一个样本,用其样本平均日产量来估计总体平均日产量。计总体平均日产量。总体平均数总体平均数为:为:2 25 5(件件)4 41 10 00 0NXXNXX2)(所有可能样本个数:所有可能样本个数:M =4 44 4 =1616 样本样本 22 24 26 2822242628 22 23 24 25 23 24 25 2
8、6 24 25 26 27 25 26 27 28 试计算样本平均日产量的抽样平均误差。试计算样本平均日产量的抽样平均误差。(N=4 4 n=2 2)总体总体标准差标准差为:为:(件件)5 54 42 20 0 在重复抽样条件下,所有可能在重复抽样条件下,所有可能的样本及样本平均日产量如的样本及样本平均日产量如右表右表2022-10-4 重复抽样的样本平均数及其离差(抽样误差)重复抽样的样本平均数及其离差(抽样误差)样本序号样本序号样本单位样本单位 样本平均数样本平均数 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9101011111212131314141515161
9、6 AA AB AC AD BA BB BC BD CA CB CC CD DA DB DC DD2222232324242525232324242525262624242525262627272525262627272828合计合计400400离差离差 离差平方离差平方 -3-3-2-2-1-1 0 0-2-2-1-1 0 0 1 1-1-1 0 0 1 1 2 2 0 0 1 1 2 2 3 3 0 0 9 94 41 10 04 41 10 01 11 10 01 14 40 01 14 49 94040 xXx25X2)(Xx 2022-10-4.样本平均样本平均数的抽样数的抽样平均误
10、差平均误差MXxx2)((用定义公式计算)(用定义公式计算)nnx2(用应用公式计算)(用应用公式计算)结论:结论:第一,所有可能样本平均数的平均数等于总体平均数第一,所有可能样本平均数的平均数等于总体平均数 Mxx2 25 5(件件)NXX Mxx 第二,样本平均数的标准差(抽样平均误差)仅为总体第二,样本平均数的标准差(抽样平均误差)仅为总体标准差标准差的的n11 1.5 58 81 1(件件)2 25 52 2.5 51 16 64 40 01 1.5 58 81 1(件件)X即:即:1 16 64 40 00 02 25 5(件件)2022-10-4.其所有可能样本及样本平均日产量其所
11、有可能样本及样本平均日产量如下:如下:在不重复抽样条件下,所有可能样本个数:在不重复抽样条件下,所有可能样本个数:M =4 43 3 =1212 样本样本 22 24 26 2822242628 23 24 25 23 25 26 24 25 27 25 26 27 重复抽样的样本平均数及其离差(抽样误差)重复抽样的样本平均数及其离差(抽样误差)样本序号样本序号样本单位样本单位 样本平均数样本平均数 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9101011111212 AB AC AD BA BC BD CA CB CD DA DB DC 23232424252523
12、2325252626242425252727252526262727合计合计 离差离差 -2-2-1-1 0 0-2-2 0 0 1 1-1-1 0 0 2 2 0 0 1 1 2 2 0 0 300300离差平方离差平方 4 41 10 04 40 01 11 10 04 40 01 14 42020Xx2)(Xx 25Xx10/4/2022.Nnn11样本平均样本平均数的抽样数的抽样平均误差平均误差MXxx2)((用定义公式计算)(用定义公式计算)1 12 22 20 01 1.2 29 91 1(件件)1NnNnx2(用应用公式计算)(用应用公式计算)1 1.2 29 91 1(件件)1
13、 14 42 24 42 25 5结论:结论:第一,所有可能样本平均数的平均数等于总体平均数第一,所有可能样本平均数的平均数等于总体平均数,Mxx2 25 5(件件)NXX Mxx 第二,样本平均数的标准差(抽样平均误差)仅为总体标准差第二,样本平均数的标准差(抽样平均误差)仅为总体标准差的的X即:即:1 12 23 30 00 02 25 5(件件)2022-10-42.2.样本成数的抽样平均误差样本成数的抽样平均误差p 由于总体成数可以表现为是非标志(,)分布的平均由于总体成数可以表现为是非标志(,)分布的平均数,而且它的标准差也可以从总体成数推算出来,数,而且它的标准差也可以从总体成数推
14、算出来,因此,可以从样本平均数的抽样平均误差和总体标准差的因此,可以从样本平均数的抽样平均误差和总体标准差的关系推出样本成数的抽样平均误差的计算公式。关系推出样本成数的抽样平均误差的计算公式。PXp)1(PPP(1 1)重复抽样:)重复抽样:nPPnPp)1((2 2)不重复抽样:)不重复抽样:NnnPPp1)1(注意:注意:在实际计算在实际计算抽样平均误差时抽样平均误差时,当当总体成数总体成数P未知未知时,可用时,可用样本成数样本成数 p 来代替。即来代替。即:2022-10-4.nnPPnppPp)1()1(例例:要估计某高校要估计某高校1000010000名在校生的近视率,现随机从中名在
15、校生的近视率,现随机从中抽取抽取400400名,检查有近视眼的学生名,检查有近视眼的学生320320名,试计算样本近视名,试计算样本近视率的抽样平均误差。率的抽样平均误差。(1 1)在重复抽样条件下,)在重复抽样条件下,样本近视率样本近视率的抽样平均的抽样平均误差为:误差为:解:根据已知条件:解:根据已知条件:%18 80 00 0.8 84 40 00 03 32 20 0nnpnnPPppp)1()1(0 0.0 02 24 40 00 00 0.2 20 0.8 8%2 22022-10-4(2 2)在不重复抽样条件下,)在不重复抽样条件下,样本近视率样本近视率的抽样平均的抽样平均误差为
16、:误差为:)(1)1(Nnnppp)1 10 00 00 00 04 40 00 0(1 14 40 00 00 0.2 20 0.8 8 计算结果表明,用样本的近视率来估计总体的近视率其计算结果表明,用样本的近视率来估计总体的近视率其抽样平均误差为抽样平均误差为2 2左右(即用样本的近视率来估计总体的左右(即用样本的近视率来估计总体的近视率其误差的绝对值平均说来在近视率其误差的绝对值平均说来在2 2左右)。左右)。%1 1.9 96 62022-10-4(三)影响抽样(平均)误差大小的因素(三)影响抽样(平均)误差大小的因素nnx2Nnnx11.1.总体标准差总体标准差(总体标志变异程度)(
17、总体标志变异程度)2.2.样本单位数样本单位数3.3.抽样方法抽样方法4.4.抽样的组织方式抽样的组织方式 例如:例如:要使要使抽样误差减少为原来的抽样误差减少为原来的一半一半,则样本容量将为原来的,则样本容量将为原来的4 4倍倍。它与它与成正比例变化。成正比例变化。它与它与成反比例变化成反比例变化。重复抽样的重复抽样的总是大于不重复抽样的总是大于不重复抽样的。抽样的组织方式不同,抽样误差也不同。抽样的组织方式不同,抽样误差也不同。2022-10-4抽样极限误差抽样极限误差是指在一定概率下是指在一定概率下样本指标样本指标与与总体指标总体指标之间之间抽样误差的可允许范围。抽样误差的可允许范围。三
18、、抽样极限误差三、抽样极限误差 抽样极限误差是从另外一个角度来考虑抽样误差的问题。抽样极限误差是从另外一个角度来考虑抽样误差的问题。或或的的误误差差绝绝对对值值不不超超过过或或相相应应总总体体指指标标与与或或本本指指标标在在一一定定概概率率下下可可认认为为样样上上式式表表示示 pxPXpx)(:(xXxpPp一般情况下只进行一次具体的抽样。所以,不能只研究一般情况下只进行一次具体的抽样。所以,不能只研究抽样平均误差,还必须研究某一次具体抽样的抽样误差抽样平均误差,还必须研究某一次具体抽样的抽样误差的可能范围,即抽样极限误差。的可能范围,即抽样极限误差。2022-10-4 样本平均数的抽样极限误
19、差样本平均数的抽样极限误差xXx 样本成数的抽样极限误差样本成数的抽样极限误差pPpxxxXx)(xxxx,ppppP)(pppp,在参数估计时,由于实际误差无法计算,只能用抽样在参数估计时,由于实际误差无法计算,只能用抽样平均误差来反映抽样误差的大小。平均误差来反映抽样误差的大小。而某一次抽样的实际误差可能为正,也可能为负,其而某一次抽样的实际误差可能为正,也可能为负,其绝对值可能大于或小于抽样平均误差。绝对值可能大于或小于抽样平均误差。抽样极限误差抽样极限误差是是抽样误差抽样误差的的可能范围可能范围而非完全肯定的而非完全肯定的范围。故这个可能范围的大小与概率是紧密联系的。范围。故这个可能范
20、围的大小与概率是紧密联系的。2022-10-4 粮食总产量在粮食总产量在2000020000(4004005 5)公斤,即)公斤,即在在790790810810万公斤之间。万公斤之间。例如例如,要估计某乡粮食亩产量和总产量,从该要估计某乡粮食亩产量和总产量,从该乡乡2 2万亩万亩粮食作物中抽取粮食作物中抽取400400亩亩,求得其平均亩,求得其平均亩产量为产量为400400公斤公斤。如果确定抽样极限误差为。如果确定抽样极限误差为5 5公公斤斤,试估计该乡粮食亩产量和总产量所在的置试估计该乡粮食亩产量和总产量所在的置信区间。信区间。即该乡粮食亩产量的区间落在即该乡粮食亩产量的区间落在400400
21、5 5公斤公斤的范围内,即在的范围内,即在395395405405公斤之间。公斤之间。4 40 00 0 x5 5 x2022-10-4 又如又如,要估计某高校,要估计某高校1000010000名名在校生的近视率,在校生的近视率,现随机从中抽取现随机从中抽取400400名名,计算的,计算的近视率为近视率为8080,如果确定允许误差范围为如果确定允许误差范围为4 4,试估计该高校在,试估计该高校在校生近视率所在的置信区间。校生近视率所在的置信区间。即该校学生近视率的区间将落在即该校学生近视率的区间将落在80804 4的范围内,即在的范围内,即在76768484之间。之间。%4 48 80 0 x
22、p2022-10-4四、抽样估计的概率度和置信度四、抽样估计的概率度和置信度 抽样估计时,抽样估计时,基于基于概率估计概率估计要求,要求,抽样极限误差抽样极限误差为为标标准准单单位位来来衡衡量量。或或px得相对数得相对数t t,表示误差范围为抽样平均误差的,表示误差范围为抽样平均误差的t t倍。倍。px或或,通常需要以通常需要以抽样平均误差抽样平均误差ppxx或或,分分别别除除以以或或所所以以,把把抽抽样样极极限限误误差差(一)抽样估计的概率度(一)抽样估计的概率度2022-10-4;xxtxxt;pptppt t 是测量抽样估计可靠程度的一个参数,称为是测量抽样估计可靠程度的一个参数,称为抽
23、抽样误差的概率度样误差的概率度,即临界值即临界值2/zt2/zxxz2/ppz2/2022-10-4 如上例,如上例,已知某乡粮食亩产量的标准差为已知某乡粮食亩产量的标准差为=8080公斤,总体单位数公斤,总体单位数N=2000020000亩,样本单位亩,样本单位数数 n=400400亩,求得其抽样平均误差为亩,求得其抽样平均误差为。(公公斤斤)4 44 40 00 08 80 0nx 如果确定抽样极限误差为如果确定抽样极限误差为5 5公斤,则,我们可以用概公斤,则,我们可以用概率度:率度:xxt1 1.2 25 54 45 5 表示抽样极限的误差范围,即用表示抽样极限的误差范围,即用1.25
24、1.25x 来规定误差范围来规定误差范围的大小。的大小。2022-10-4(二)抽样估计的置信度(二)抽样估计的置信度样本指标随着样本的变动而变动,是个随机变量,样本指标与样本指标随着样本的变动而变动,是个随机变量,样本指标与总体指标的误差也是个随机变量,并不能保证误差不超过一定总体指标的误差也是个随机变量,并不能保证误差不超过一定范围这件事是必然的,而只能给以一定程度的概率保证范围这件事是必然的,而只能给以一定程度的概率保证,一般一般用用 F(t F(t)表示,)表示,)(tFXxxProb)(tFtxXtxxxProb 总体平均数总体平均数抽样估计的置信度(可靠程度):抽样估计的置信度(可
25、靠程度):总体成数总体成数抽样估计的置信度:抽样估计的置信度:)(tFPppProb)(tFtpPtpppProb表示。表示。或1或11 11 11 12022-10-4在进行抽样估计时,我们既希望抽样估计的误差尽可能小。在进行抽样估计时,我们既希望抽样估计的误差尽可能小。置信区间越小,说明估计的精确性越高;置信区间越大,置信区间越小,说明估计的精确性越高;置信区间越大,说明估计的精确性较低。说明估计的精确性较低。同时又希望抽样估计的把握程同时又希望抽样估计的把握程度(概率)尽可能大。但事实上着两者往往是矛盾的度(概率)尽可能大。但事实上着两者往往是矛盾的。注意:注意:)(tFXxxProb)
展开阅读全文