统计学原理第六章抽样调查课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《统计学原理第六章抽样调查课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 原理 第六 抽样调查 课件
- 资源描述:
-
1、第六章第六章 抽样调查 第一节第一节 抽样调查的意义抽样调查的意义 一、抽样调查的概念一、抽样调查的概念一一般所讲的般所讲的抽样调查抽样调查,即指,即指狭义的抽样调狭义的抽样调查查(随机抽样随机抽样):按照随机原则从总体中抽取:按照随机原则从总体中抽取一部分单位进行观察,并运用数理统计的原一部分单位进行观察,并运用数理统计的原理,以被抽取的那部分单位的数量特征为代理,以被抽取的那部分单位的数量特征为代表,对总体作出数量上的推断分析。表,对总体作出数量上的推断分析。二、抽样调查的特点二、抽样调查的特点 (一)抽样调查的目的是由部分来推断整体。(一)抽样调查的目的是由部分来推断整体。(二)抽选部分
2、单位时要遵循随机原则(二)抽选部分单位时要遵循随机原则(三)抽样调查会产生抽样误差,抽样误差(三)抽样调查会产生抽样误差,抽样误差可以计算,并且可以加以控制。可以计算,并且可以加以控制。三、抽样调查的适用范围三、抽样调查的适用范围 抽抽样调查方法是市场经济国家在调查方法样调查方法是市场经济国家在调查方法上的必然选择,和普查相比,它具有准确度高、上的必然选择,和普查相比,它具有准确度高、成本低、速度快、应用面广等优点。成本低、速度快、应用面广等优点。(一)实(一)实际工作不可能进行全面调查观察,而又需要际工作不可能进行全面调查观察,而又需要了解其全面资料的事物;了解其全面资料的事物;(二)虽(二
3、)虽可进行全面调查观察,但比较困难或并不必可进行全面调查观察,但比较困难或并不必要;要;(五)对(五)对普查或全面调查统计资料的质量进行检查和普查或全面调查统计资料的质量进行检查和修正;修正;(四)在(四)在有些情况下,抽样调查的结果比全面调查要有些情况下,抽样调查的结果比全面调查要准确。准确。(七)利(七)利用抽样推断的方法,可以对于某种总体的假用抽样推断的方法,可以对于某种总体的假设进行检验,判断这种假设的真伪,以决定取舍。设进行检验,判断这种假设的真伪,以决定取舍。一般适用于以下范围:一般适用于以下范围:(三)(三)和和全面调查相比较,抽样调查能节省人力、费全面调查相比较,抽样调查能节省
4、人力、费用和时间,而且比较灵活用和时间,而且比较灵活(六)(六)抽抽样调查方法可以用于工业生产过程中的质量样调查方法可以用于工业生产过程中的质量控制。控制。一、一、全及总体和抽样总体全及总体和抽样总体(一一)全及总体,简称总体全及总体,简称总体全全及总体:所要认识对象的全体。及总体:所要认识对象的全体。总体单位数用总体单位数用N表示。表示。全全 及及总体按其单位标志性质不同分为:变总体按其单位标志性质不同分为:变量总体和属性总体。量总体和属性总体。变量总体可以用数量标示加以计量。变量总体可以用数量标示加以计量。属性总体用文字描写属性特征。如:属性总体用文字描写属性特征。如:完好、非完好。完好、
5、非完好。第二节第二节 抽样调查的基本概念及理论依据抽样调查的基本概念及理论依据 一、一、全及总体和抽样总体全及总体和抽样总体(二二)抽样总体,简称样本抽样总体,简称样本第二节第二节 抽样调查的基本概念及理论依据抽样调查的基本概念及理论依据 抽抽样总体:抽取出来调查观察的单位。样总体:抽取出来调查观察的单位。抽样总体的单位数用抽样总体的单位数用n表示。表示。n 30 大样本大样本 n 30 小样本小样本 二、二、全及指标和抽样指标全及指标和抽样指标(总体指标和样本指标总体指标和样本指标)全全及指标:全及总体的那些指标。及指标:全及总体的那些指标。(一)全及指标(一)全及指标212122.()()
6、NXPXXXNNNXXNXXN 全全及及平平均均数数全全及及成成数数总总体体方方差差总总体体标标准准差差 (二)抽样指标(二)抽样指标抽抽样指标:抽样总体的那些指标。样指标:抽样总体的那些指标。212122.()()NxpssxxxNnnx xNx xN 抽抽样样平平均均数数抽抽样样成成数数样样本本方方差差样样本本标标准准差差 (三)统计抽样过程(图(三)统计抽样过程(图6-16-1,p255p255)xXpP所所谓谓,就就是是用用抽抽样样指指标标来来推推断断全全及及指指标标。是是用用抽抽样样平平均均数数 推推断断全全及及平平均均数数,从从而而推推断断总总体体标标志志总总量量是是用用抽抽样样成
7、成数数 推推断断全全及及成成数数,从从而而推推断断总总推推断断一一体体二二单单位位总总量量 三、抽样方法和样本可能数目三、抽样方法和样本可能数目根据取样的方式不同,抽样方式分为:重复抽样和不重复抽样。根据取样的方式不同,抽样方式分为:重复抽样和不重复抽样。根据对样本的要求不同,抽样方式分为:考虑顺序抽样和不考根据对样本的要求不同,抽样方式分为:考虑顺序抽样和不考虑顺序抽样。虑顺序抽样。抽样方法抽样方法样本可能数目(样本可能数目(p256-257p256-257,了解),了解)1.1.如果是重复抽样:如果是重复抽样:1(2)nnNNnDC 考考虑虑顺顺序序的的重重复复抽抽样样:不不虑虑顺顺序序的
8、的重重复复抽抽样样:样样本本种种数数种种考考5(1)()50312,500,000nnNBN 例例2.2.如果是不重复抽样如果是不重复抽样:)!(!)()(nNNnNNNNAnN 121考虑顺序的不重复抽样:考虑顺序的不重复抽样:例例)(种2002512544647484950550 A不考虑顺序的不重复抽样不考虑顺序的不重复抽样:)!(!nNnNCnN 例例)(!种7601182123452002512545550550 AC 四、抽样调查的理论依据(四、抽样调查的理论依据(p257-259p257-259,了解),了解)(1)独立同分布大数定律)独立同分布大数定律(2)贝努大数定律)贝努大
9、数定律1.1.大数定律大数定律2.2.中心极限定理(中心极限定理(p256-257p256-257,了解),了解)(1)独立同分布中心极限定理)独立同分布中心极限定理(2)德莫佛)德莫佛-拉普拉斯中心极限定理拉普拉斯中心极限定理第三节第三节 抽样平均误差抽样平均误差 一、抽样误差的概念一、抽样误差的概念 登登记记误误差差系系统统性性误误差差统统计计误误差差代代表表性性误误差差实实际际误误差差随随机机误误差差抽抽样样平平均均误误差差在统计调查中,调查资料与实际情况不一致,在统计调查中,调查资料与实际情况不一致,两者的偏离称为统计误差。两者的偏离称为统计误差。抽样误差抽样误差即指随机误差,这种误差
10、是抽即指随机误差,这种误差是抽样调查固有的误差,是无法避免的。样调查固有的误差,是无法避免的。xXpP实实际际误误差差就就是是指指样样本本指指标标和和总总体体指指标标之之间间数数量量上上的的差差别别,即即、。无无法法知知道道。抽抽样样平平均均误误差差是是指指所所用用可可能能出出现现的的样样本本指指标标的的标标准准差差。可可以以计计算算。二、影响抽样平均误差的因素二、影响抽样平均误差的因素 (一)(一)全全及总体标志变异程度。及总体标志变异程度。正比关系正比关系(二)(二)抽抽样单位数目的多少。样单位数目的多少。反比关系反比关系(三)抽样的组织方式。(三)抽样的组织方式。三、抽样平均误差的意义三
11、、抽样平均误差的意义1.在在于说明样本指标的代表性大小。于说明样本指标的代表性大小。误差大,则样本指标代表性低;误差大,则样本指标代表性低;误差小,则样本指标代表性高;误差小,则样本指标代表性高;误差等于误差等于0,则样本指标和总体指标一样大。,则样本指标和总体指标一样大。2.说说明样本指标和总体指标相差的一般范围。明样本指标和总体指标相差的一般范围。3.确定抽样单位数多少的计算依据。确定抽样单位数多少的计算依据。四四、抽样抽样平均误差的计算平均误差的计算 抽样平均误差抽样平均误差实际上是样本指标的标准差。实际上是样本指标的标准差。通常用通常用表示。表示。(一)抽样平均数的抽样平均误差(一)抽
12、样平均数的抽样平均误差2()K xKXx抽样平均误差全部可能的样本个数1.1.重复抽样条件下抽样平均数的抽样平均误差重复抽样条件下抽样平均数的抽样平均误差2 nn x抽样平均误差2.2.不重复抽样条件下抽样平均数的抽样平均误差不重复抽样条件下抽样平均数的抽样平均误差222211111nnnn xNnnNNnnNnNNN当很小时,接近于,与很接近。抽样平均误差四四、抽样抽样平均误差的计算平均误差的计算(二)抽样成数的抽样平均误差(二)抽样成数的抽样平均误差(1)pppn抽样平均误差重复抽样条件下抽样成数的抽样平均误差重复抽样条件下抽样成数的抽样平均误差不重复抽样条件下抽样成数的抽样平均误差不重复
13、抽样条件下抽样成数的抽样平均误差(1)1 ppnpnN抽样平均误差四四、抽样抽样平均误差的计算平均误差的计算 1.1.用过去调查所得的资料。用过去调查所得的资料。3.3.用小规模调查资料。用小规模调查资料。计算抽样平均误差时 和p都是全及指标,一般未知,通常采取四种方法解决:2.2.用样本方差的资料代替总体方差。用样本方差的资料代替总体方差。4.4.用估计的材料。用估计的材料。(三)抽样平均误差计算实例(三)抽样平均误差计算实例(p270-271)2 1020304050X30()525()五户家庭三月份购买某商品的支出:元,元,元,元,元元现从五户中抽取二户作调查,如果为重复抽样 考虑顺序种
14、排列组合如下:例101010-20 400102015-15 225103020-10 100104025 -5 25105030 0 0201015-15 225202020-10 100203025 -5 25204030 0 0205035 5 25301020-10 100302025 -5 25303030 0 0 x样样本本平平均均数数xX 误误差差 2xX 抽抽取取样样本本x样样本本平平均均数数xX 误误差差 2xX 抽抽取取样样本本304035 5 2530504010 100401025-5 25402030 0 0403035 5 2540404010 1004050451
15、5 225501030 0 0502035 5 2550304010 10050404515 22550 505020 400合 计-2 500接左:接左:)()(10252500)()(2为样本配合总数元抽样平均误差nnXxx 以上资料编成次数分配表如下:以上资料编成次数分配表如下:x样本数样本数f(f(即次数分配即次数分配)101-20152-15203-10254 -5305 0354 5403 10452 15501 20合计 25 -xX 2(xX)ff 抽样误差抽样误差是所有可能出现的样本指标的标是所有可能出现的样本指标的标准差。它是由于抽样的随机性而产生的样本准差。它是由于抽样的
16、随机性而产生的样本指标与总体指标之间的平均离差。指标与总体指标之间的平均离差。255410()X30()21C 种种元元抽取样本抽取样本样本平均数样本平均数离差离差10 2015-1522510 3020-1010010 4025-5 2510 5030 0 020 3025-5 2520 4030 0 020 5035 5 2530 4035 5 2530 50401010040 504515225合 计-750 xxX 2xX)(66.810750)(元抽样平均误差n)X-x(2x上例五户中抽取二户调查,如采取不考虑顺序的不重复抽上例五户中抽取二户调查,如采取不考虑顺序的不重复抽样方法,则
17、:样方法,则:第四节第四节 全及指标的推断全及指标的推断 一、抽样推断要求一、抽样推断要求抽样推断就是按照已经抽定的样本指标来估抽样推断就是按照已经抽定的样本指标来估计总体指标,或其所在的区间范围。计总体指标,或其所在的区间范围。只要在样本代表性大,且对全及指标精确只要在样本代表性大,且对全及指标精确性要求不高的情况下,满足下列三个准则性要求不高的情况下,满足下列三个准则:无偏性无偏性一致性一致性有效性有效性就会得到合理的估计。就会得到合理的估计。抽样指标估计总体指标有三个要求:(抽样指标估计总体指标有三个要求:(p272)(一一)点估计点估计xXpP是是由由样样本本指指标标直直接接代代替替全
18、全及及指指标标,不不考考虑虑任任何何抽抽样样误误差差因因素素。即即用用 直直接接代代表表,用用直直接接代代表表。就就100 x 1002p98%X 1002P98%在在全全部部产产品品中中,抽抽取取件件进进行行仔仔细细检检查查,得得到到平平均均重重量量克克,合合格格率率,我我们们直直接接推推断断全全部部产产品品的的平平均均重重量量克克,合合格格率率。例二、抽样推断的方法二、抽样推断的方法1.1.直接换算法直接换算法抽样平均数抽样平均数(成数成数)总体单位数总体单位数=总体标志总量总体标志总量1.如如果采用点估计方法:上例果采用点估计方法:上例1中:中:40010000=400(万千克万千克)如
19、果用区间估计方法:上例如果用区间估计方法:上例1中该农场小麦总产量的范围中该农场小麦总产量的范围为:为:t=2:(397.62 402.38)10000=397.62 402.38(万千克万千克)t=3:(396.43 403.57)10000=396.43 403.57(万千克万千克)2.上上例例2中,全部一级品数量的范围为:中,全部一级品数量的范围为:(92.82%97.18%)8000=7425.6 7774.4(件件)2.2.修正分数法修正分数法就就是用抽样所得的调查结果同有关资料是用抽样所得的调查结果同有关资料对比的系数来修正全面统计资料时采用的一对比的系数来修正全面统计资料时采用的
20、一种方法。种方法。某村某村60006000农户,农户,20052005年年末统计养猪头数,年年末统计养猪头数,从下往上报的是从下往上报的是90009000头,现抽头,现抽1010(600(600户户)的的农户再复查一下,发现有漏报,也有重报。按农户再复查一下,发现有漏报,也有重报。按600600户,原来数字是户,原来数字是890890头,实际复查为头,实际复查为935935头,头,故总的来说,是少报。故总的来说,是少报。)(9455%)06.51(9000 6000%06.5%06.589045)(45890935 头农户养猪头数,即:的系数来修正可用差错率头例例1)(09.3226%)248
21、.01(1.3218%248.003.41503.1万元年报工资总额正工资总额,则:根据这一系数,再来修差错率某市房地局,年报工资总额某市房地局,年报工资总额3218.13218.1万元。万元。现抽查现抽查1414个单位:个单位:年报:年报:415.03415.03万元万元 多报:多报:0.440.44万元万元 少报:少报:1.471.47万元万元抵冲后抵冲后 1.47-0.44=1.03(1.47-0.44=1.03(万元万元)例2(二二)区间估计区间估计根据样本指标和抽样误差去推断全根据样本指标和抽样误差去推断全及指标的可能范围,它能说清楚估计的及指标的可能范围,它能说清楚估计的准确程度和
22、把握程度。准确程度和把握程度。1.区间估计的意义区间估计的意义 抽样极限误差又叫抽样误差范围,也称置信区间,是变抽样极限误差又叫抽样误差范围,也称置信区间,是变动的抽样指标与确定的全及指标之间的离差的可能范围。动的抽样指标与确定的全及指标之间的离差的可能范围。2.抽样极限误差抽样极限误差pxppxxpxxXxpPpXxPp()()x X p P 即即:全全及及平平均均数数 成成数数抽抽样样平平均均数数 成成数数 抽样误差范围的实际意义抽样误差范围的实际意义是要求被估计的是要求被估计的全及指标全及指标 或或P落在抽样指标一定范围内,即落在抽样指标一定范围内,即落在落在 Xxx 或或pp 的范围内
23、。的范围内。当当F(t)=68.27%F(t)=68.27%时,抽样极限误差等于抽样平均误差的时,抽样极限误差等于抽样平均误差的1 1倍倍(t=1);(t=1);当当F(t)=95.45%F(t)=95.45%时,抽样极限误差等于抽样平均误差的时,抽样极限误差等于抽样平均误差的2 2倍倍(t=2);(t=2);当当F(t)=99.73%F(t)=99.73%时,抽样极限误差等于抽样平均误差的时,抽样极限误差等于抽样平均误差的3 3倍倍(t=3);(t=3);例例3.可信程度可信程度抽样极限误差抽样极限误差=t,(,(t为概率度)为概率度)可见,抽样极限误差,即扩大或缩小了以后的可见,抽样极限误
24、差,即扩大或缩小了以后的抽样误差范围。抽样误差范围。P(277)xxppF(t)xXxpPp()()t 在在概概率率的的保保证证下下:即即:全全及及平平均均数数 成成数数抽抽样样平平均均数数 成成数数)403.57(100003)99.73%(t(3)402.38(100002)95.45%(t 千克亩产量的可能范围为:亩小麦的平均保证,该农场若以概率千克亩产量的可能范围为:亩小麦的平均保证,该农场若以概率千克43.39619.1340062.39719.12400)2()(19.1)100001001(10012)1()1(22XxXNnnxx某农场进行小麦产量的抽样调查,该农场小麦播种面积
25、为某农场进行小麦产量的抽样调查,该农场小麦播种面积为1000010000亩,采用不重复的简单随机抽样从中选亩,采用不重复的简单随机抽样从中选100100亩作为样亩作为样本,进行实割实测,得到样本的平均亩产量为本,进行实割实测,得到样本的平均亩产量为400400千克,千克,样本标准差为样本标准差为1212千克。千克。则:则:例例1pp380p100%95%400P(1P)95%(195%)1.09%n40095.45%Pp95%2 1.09%92.82%97.18%在概率的保证下,全及一级品率:某机械厂日产某种产品某机械厂日产某种产品80008000件,现采用纯随机不重复件,现采用纯随机不重复抽
展开阅读全文