抽样误差的概率度课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《抽样误差的概率度课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样误差 概率 课件
- 资源描述:
-
1、抽样估计在统计方法中的地位抽样估计在统计方法中的地位统计方法统计方法描述统计描述统计推断统计推断统计抽样理论抽样理论假设检验假设检验参数估计参数估计概率理论概率理论回归分析回归分析第一节第一节 抽样调查的意义及基本概念抽样调查的意义及基本概念 一、抽样调查的意义一、抽样调查的意义一一般所讲的抽样调查,即指狭义的抽样调般所讲的抽样调查,即指狭义的抽样调查查( (随机抽样随机抽样) ):按照随机原则按照随机原则从总体中抽取一从总体中抽取一部分单位进行观察,并运用数理统计的原理,部分单位进行观察,并运用数理统计的原理,以被抽取的那部分单位的数量特征为代表,以被抽取的那部分单位的数量特征为代表,对对总
2、体作出数量上的推断分析。总体作出数量上的推断分析。二、抽样调查的特点二、抽样调查的特点 1、只抽取总体中的一部分单位作样本进行调查;、只抽取总体中的一部分单位作样本进行调查; 2、它是由样本的指标数值去推断总体的指标数值;、它是由样本的指标数值去推断总体的指标数值; 3、抽选样本单位时要遵循随机原则;、抽选样本单位时要遵循随机原则; 4、抽样推断会产生抽样误差,抽样误差可以计、抽样推断会产生抽样误差,抽样误差可以计 算、并且可以事先加以控制。算、并且可以事先加以控制。 登登记记误误差差系系统统性性误误差差统统计计误误差差代代表表性性误误差差实实际际误误差差随随机机误误差差抽抽样样平平均均误误差
3、差 登记性误差登记性误差也叫调查误差或工作误差,是指在调查登记、汇总计算过程中发生的误差(应设法避免)。 代表性误差代表性误差这是指用部分单位的统计数据去推算总体数据时所产生的误差(即样本不足以代表总体产生的误差)。(随意)(随意)三、抽样调查的适用范围三、抽样调查的适用范围 抽抽样调查方法是市场经济国家在调样调查方法是市场经济国家在调查方法上的必然选择,和普查相比,它查方法上的必然选择,和普查相比,它具有准确度高、成本低、速度快、应用具有准确度高、成本低、速度快、应用面广等优点。面广等优点。1.1.实实际工作不可能进行全面调查观察,而又需要了解际工作不可能进行全面调查观察,而又需要了解其全面
4、资料的事物;其全面资料的事物;2.2.虽虽可进行全面调查观察,但比较困难或并不必要;可进行全面调查观察,但比较困难或并不必要;3.3.对对普查或全面调查统计资料的质量进行检查和修正;普查或全面调查统计资料的质量进行检查和修正;4.4.抽抽样方法适用于对大量现象的观察,即组成事物样方法适用于对大量现象的观察,即组成事物总体的单位数量较多的情况;总体的单位数量较多的情况;5.5.利利用抽样推断的方法,可以对于某种总体的假设用抽样推断的方法,可以对于某种总体的假设进行检验,判断这种假设的真伪,以决定取舍。进行检验,判断这种假设的真伪,以决定取舍。一般适用于以下范围:一般适用于以下范围: 第二节第二节
5、 抽样推断的基本概念及理论依据抽样推断的基本概念及理论依据一、全及总体和样本总体一、全及总体和样本总体( (总体和样本总体和样本) )全全及总体及总体:它是指所要研究对象的全体它是指所要研究对象的全体 。 总体单位数用总体单位数用N N表示。表示。样本样本总体总体:是从全及总体中随机抽选出来、是从全及总体中随机抽选出来、 代表全及总体接受调查的那部分代表全及总体接受调查的那部分 单位的集合体。单位的集合体。 样本总体的单位数用样本总体的单位数用n n表示。表示。 n 30 n 30 大样本大样本 n 30 n 30 小样本小样本 二、总体指标和样本指标二、总体指标和样本指标总体总体指标:反映总
6、体数量特征的综合指标,又称总体指标:反映总体数量特征的综合指标,又称总体参数。(唯一)参数。(唯一)样本样本指标:反映样本数量特征的综合指标,又称样本指标:反映样本数量特征的综合指标,又称样本统计量。(随机)统计量。(随机)抽样推断:抽样推断:就是用已知的样本指标,对总体指就是用已知的样本指标,对总体指标及其变化范围进行科学的估计和推算。标及其变化范围进行科学的估计和推算。 成数的概念成数的概念 若总体单位的某种标志只有两种表现,若总体单位的某种标志只有两种表现,总体成数总体成数是指具是指具有某种特征和属性的单位在全部总体单位重所占比重。记为有某种特征和属性的单位在全部总体单位重所占比重。记为
7、p。 以以 代表个总体单位中具有某种特征的单位数,代表个总体单位中具有某种特征的单位数, 代表代表总体单位中不具有某种特征的单位数,总体单位中不具有某种特征的单位数,N=N1+N0。有。有1N0NNNP1 从总体中随机抽出容量为从总体中随机抽出容量为n的样本,具有某的样本,具有某种特征的单位数为种特征的单位数为 n1,则,则样本的成数:样本的成数: 。 例如,某工厂生产某种电子元件,某批产品例如,某工厂生产某种电子元件,某批产品共共10000件,其中不合格品件,其中不合格品100件,则不合格品所占件,则不合格品所占的成数的成数 。若从中按随机的原则抽。若从中按随机的原则抽100件,其中件,其中
8、有有3件不合格品,则样本的成数为件不合格品,则样本的成数为 。nnp1%1P%3p指标名称指标名称 参数参数 统计量统计量 平平 均均 数数成成 数数 N1/N p n1/n = 1P q = 1p方方 平均数方差 差差 成数方差 2 = P(1- P) s2 = p(1p) 总体指标和样本指标的比照总体指标和样本指标的比照NXXFXFXnxxfxfxF2F)-(21f)(s22fxx三、抽样方式及其可能的样本数目三、抽样方式及其可能的样本数目1、抽样方式、抽样方式 考虑顺序 重复抽样 不考虑顺序 不重复抽样 2、样本的可能数目、样本的可能数目(1)考虑顺序考虑顺序的的不重复抽样不重复抽样样本
9、数目样本数目 AnN=N(N1)(N2)(Nn1)N!/(N-n)!(2)考虑顺序考虑顺序的的重复抽样重复抽样样本数目()样本数目() BnNNn(3)不考虑顺序不考虑顺序的的不重复抽样不重复抽样样本数目()样本数目()CnNN(N1)(N2) )(N Nn n1 1)/n! /n! )!( !nNnN(4)不考虑顺序的重复抽样样本数目)不考虑顺序的重复抽样样本数目 DnNCnNn1 )!1( !)!1(NnnN3、抽样推断的理论依据、抽样推断的理论依据 (1)大数定律大数定律 。 大数法则论证了抽样平均数趋近于总体平均大数法则论证了抽样平均数趋近于总体平均数的趋势,这为抽样推断提供了重要的依
10、据。但数的趋势,这为抽样推断提供了重要的依据。但是,抽样平均数和总体平均数的离差究竟有多大?是,抽样平均数和总体平均数的离差究竟有多大?离差不超过一定范围的概率究竟有多少?这个离离差不超过一定范围的概率究竟有多少?这个离差的分布怎样?这个问题要利用另一重要定理差的分布怎样?这个问题要利用另一重要定理即中心极限定理来研究。即中心极限定理来研究。1)(limnXpxiN (2)中心极限定律中心极限定律 中心极限定理是研究随机变量和的分布序列中心极限定理是研究随机变量和的分布序列的极限定理,的极限定理,论证:论证:如果总体变量存在有限的如果总体变量存在有限的平均数和方差,那么,平均数和方差,那么,不
11、论这个总体变量的分不论这个总体变量的分布如何,随着抽样单位数(样本容量布如何,随着抽样单位数(样本容量n)的增加)的增加,抽样平均数的分布便趋近于正态分布。抽样平均数的分布便趋近于正态分布。这个结这个结论对于抽样推断是十分重要的,因为在经济现论对于抽样推断是十分重要的,因为在经济现象中变量和的分布是普遍存在的。象中变量和的分布是普遍存在的。 1(0,1)niinnXN1/1(0,1)niinXnN 第三节第三节 抽样误差抽样误差 一、抽样误差的概念及其影响程度一、抽样误差的概念及其影响程度抽样误差抽样误差是指样本统计量和总体参数之间数量上是指样本统计量和总体参数之间数量上的差别。以数学符号表示
12、,即为:的差别。以数学符号表示,即为: 、 pP 。注意不是样本个体与总体之间的差别。注意不是样本个体与总体之间的差别。xiX 抽样误差的理解:抽样误差的理解: 抽样误差是指由于抽样的随机性而产生的那一部分代表抽样误差是指由于抽样的随机性而产生的那一部分代表性误差性误差; 随机误差有两种:实际误差和抽样平均误差。随机误差有两种:实际误差和抽样平均误差。 二、抽样平均误差二、抽样平均误差1、抽样平均误差的概念、抽样平均误差的概念 抽样平均误差是指抽样平均数(或成数)的抽样平均误差是指抽样平均数(或成数)的标准差。即它反映了抽样指标与总体参数的平均标准差。即它反映了抽样指标与总体参数的平均离差程度
13、。通常用离差程度。通常用表示(样本统计量与总体参表示(样本统计量与总体参数间的数间的标准差标准差)。)。 KXxi)2( xXpP抽抽样样误误差差就就是是指指样样本本指指标标和和总总体体指指标标之之间间数数量量上上的的差差别别,即即、。抽样平均误差抽样平均误差是所有可能出现的样本指标的标准是所有可能出现的样本指标的标准差。差。它是由于抽样的随机性而产生的样本指标与它是由于抽样的随机性而产生的样本指标与总体指标之间的平均离差。总体指标之间的平均离差。 抽样实际误差是无法知道的,而抽样平均误差是可以计算的。在讨论抽样误差时,一般指的是抽样平均误差。抽样误差与抽样平均误差的区别抽样误差与抽样平均误差
14、的区别 :2、抽样平均误差的实际计算、抽样平均误差的实际计算(中心极限定理的启发)(中心极限定理的启发)推断指标重复抽样不重复抽样平均数成数nx )1 (2Nnnxnp)1 ( )1 (1 (Nnnp取得取得的途径有:的途径有: 1.1.用用过去全面调查或抽样调查的资料,若同时有过去全面调查或抽样调查的资料,若同时有n n个个的资料,应选用数值较大的那个;的资料,应选用数值较大的那个;2.2. 用用样本标准差样本标准差S S代替全及标准差代替全及标准差;3. 3. 在在大规模调查前,先搞个小规模的试验性的调查来大规模调查前,先搞个小规模的试验性的调查来确定确定S S,代替,代替;x2202()
15、100小时 某灯泡厂从一天所生产的产品10,000个中抽取100个检查其寿命,得平均寿命为2000小时(设为重复抽样),根据以往资料:=20小时,根据以往资料,产品质量不太稳定,若=200小时,)(20 1002002小时则:x例例%1374. 1)150001501 (150)98. 01 (98. 0)1 ()1 ( %14. 1150)98. 01 (98. 0)1 (%98150147 150 15000NnnppnpppnNpp若按不重复抽样方式: 某玻璃器皿厂某日生产15000只印花玻璃杯,现按重复抽样方式从中抽取150只进行质量检验,结果有147只合格,其余3只为不合格品,试求这
16、批印花玻璃杯合格率(成数)的抽样平均误差。例例三、影响抽样平均误差的因素:三、影响抽样平均误差的因素: 1. 1. 全全及总体标志变异程度及总体标志变异程度正比关系正比关系2. 2. 抽抽样单位数目的多少样单位数目的多少反比关系反比关系3. 3. 抽抽样方式样方式4. 4. 抽抽样调查的组织形式样调查的组织形式(一)抽样极限误差(一)抽样极限误差抽样极限误差抽样极限误差是指用绝对数形式表示的样本是指用绝对数形式表示的样本指标与总体指标偏差的可允许的最大范围。指标与总体指标偏差的可允许的最大范围。 x 设 与 分别表示抽样平均数与抽样成数的抽样极限误差,则有: xxXx四、抽样误差范围及其可靠程
17、度四、抽样误差范围及其可靠程度 将上式变换,可得: xXxXppPpP将上式再作变换,可得:xxxXxpppPp二、抽样误差的概率度二、抽样误差的概率度t与置信度与置信度F(t) 基于理论上的要求,抽样极限误差需要用抽样平均误差x 或p为标准单位来衡量。即把极限误差 或px相应除以 x 或 p ,得出相对的误差程度t 倍,t被称之为抽样误差的概率度抽样误差的概率度。 xxt或ppt 于是,有xtppt 抽样误差的概率度(抽样误差的概率度(t)是计量估计可靠程度)是计量估计可靠程度的一个参数;抽样估计的置信度的一个参数;抽样估计的置信度F(t)是表明样本是表明样本统计量和总体参数的误差不超过一定
18、范围的概统计量和总体参数的误差不超过一定范围的概率保证程度。二者的关系是:率保证程度。二者的关系是:概率度越大,表明抽样误差范围越大,则概率度越大,表明抽样误差范围越大,则概率保证程度(置信度)越大;反之,概率度概率保证程度(置信度)越大;反之,概率度越小,表明抽样误差范围越小,则概率保证程越小,表明抽样误差范围越小,则概率保证程度(置信度)越小。度(置信度)越小。 在大样本(n30)条件下,样本平均数的分布接近于正态分布,这时可根据概率度t和置信度F(t)的对应函数关系通过正态分布概率表互相查找。参数估计参数估计就是用样本统计量去推断总体的参数。第四节第四节 参数估计参数估计 估计量:用于估
19、计总体参数的随机变量如样本均值,样本比例、样本方差等例如: 样本均值就是总体均值的一个估计量参数用 表示,估计量用 表示估计值:估计参数时计算出来的统计量的具体值如果样本均值 x =80,则80就是的估计值估计量与估计值 (estimator & estimated value)估计量的优良性准则(无偏性)无偏性:无偏性:估计量的数学期望等于被估计的总体参数。用数学式表示为:问题: 是总体平均值的无偏估计量吗?x估计量的优良性准则(有效性)有效性:一个有效性:一个方差方差较小的无偏估计量称为一个更有效的估计量较小的无偏估计量称为一个更有效的估计量。如下图。如下图:与其他估计量相比,样本均值是一
20、个度量总体均值的与其他估计量相比,样本均值是一个度量总体均值的更有效的估计量更有效的估计量估计量的优良性准则(一致性)一致性:随着样本容量的增大,估计量越来越接近被估计的总体参数如果一估计量是一致的,则采用大样本更可靠,否则会不必要的浪费。参数估计的方法参数估计的方法一一、总体参数的点估计总体参数的点估计二二、总体参数的区间估计总体参数的区间估计点估计(概念要点)点估计(概念要点)1.从总体中抽取一个样本,根据该样本的统计量对总体的从总体中抽取一个样本,根据该样本的统计量对总体的未知参数作出一个数值点的估计未知参数作出一个数值点的估计l 例如例如: 用样本均值用样本均值作为作为总体未知均值的估
21、计值就是总体未知均值的估计值就是一个点估计一个点估计2.点估计没有给出估计值点估计没有给出估计值接近总体未知参数程度的信息接近总体未知参数程度的信息3.点估计的方法有矩估计法、顺序统计量法、最大似然法、点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等最小二乘法等100 x 1002p98%X 1002P98% 在在全全部部产产品品中中,抽抽取取件件进进行行仔仔细细检检查查,得得到到平平均均重重量量克克,合合格格率率,我我们们直直接接推推断断全全部部产产品品的的平平均均重重量量克克,合合格格率率。总体参数的区间估计1. 置信区间包含总体参数真值的次数所占的比例称为置信区间包含总体参
22、数真值的次数所占的比例称为置信置信度(置信水平)(度(置信水平)( 1-a )* 例如例如:为了估计总体的平均值,我们抽取了为了估计总体的平均值,我们抽取了100个样本,个样本,必然能得到必然能得到100个区间,置信水平说的是在这个区间,置信水平说的是在这100个个区间中,包含总体平均值的区间有(区间中,包含总体平均值的区间有(1-a)%,有有a%不包含总体平均值!不包含总体平均值!*所以并不是所有的置信区间都包括待估计的总体参数!所以并不是所有的置信区间都包括待估计的总体参数!*所以置信区间是一个随机区间所以置信区间是一个随机区间2. 常用的置信度有常用的置信度有 99%, 95%, 90%
23、相应的显著性水平相应的显著性水平 为为0.01,0.05,0.10X1. 由样本统计量所构造的总体参数的估计区间称为置由样本统计量所构造的总体参数的估计区间称为置信区间。信区间。2. 统计学家在某种程度上确信这个区间会包含真正的统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为总体参数,所以给它取名为置信区间置信区间。3. 用一个具体的样本所构造的区间是一个特定的区间,用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体我们无法知道这个样本所产生的区间是否包含总体参数的真值参数的真值我们只能是希望这个区间是大量包含总体参数真值的区间我们只
24、能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个中的一个落在总体均值某一区间内的样本落在总体均值某一区间内的样本 抽样极限误差的实际意义是要求被估计的全抽样极限误差的实际意义是要求被估计的全及指标及指标 或或 P P 落在抽样指标一定范围内,即落落在抽样指标一定范围内,即落在在 或或 的范围内。的范围内。 置信度决定抽样推断的可靠性,置信区间大置信度决定抽样推断的可靠性,置信区间大小决定抽样推断的准确性,两者是一对矛盾体。小决定抽样推断的准确性,两者是一对矛盾体。Xxx pp 点区间估计与区
展开阅读全文