抽样平均误差课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《抽样平均误差课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样 平均误差 课件
- 资源描述:
-
1、一、统计推断的一般问题一、统计推断的一般问题二、参数估计原理二、参数估计原理三、点估计三、点估计是是指利用概率论的理论指利用概率论的理论,在抽样调查或实验的基础上,利用样本的,在抽样调查或实验的基础上,利用样本的实际资料计算样本指标,并据以推算总体相应数量特征的一种统实际资料计算样本指标,并据以推算总体相应数量特征的一种统计分析方法。计分析方法。实际工作中许多现象不可能对总体的所有单位进行调查只能组织抽实际工作中许多现象不可能对总体的所有单位进行调查只能组织抽样调查。样调查。建立在随机取样的基础上。建立在随机取样的基础上。运用运用概率估计的方法概率估计的方法。抽样误差抽样误差可以事先计算并加以
2、控制。可以事先计算并加以控制。4 4、统计推断的、统计推断的内容内容1 1)参数估计参数估计:从总体中抽取一部分单位进行调查,:从总体中抽取一部分单位进行调查,进而利用样本提供的信息来推断总体的未知参数进而利用样本提供的信息来推断总体的未知参数和数值特征的方法和过程。和数值特征的方法和过程。2)假设检验:假设检验:先对总体的状况作某种假设,然后先对总体的状况作某种假设,然后再根据抽样推断的原理,根据样本观察资料对所再根据抽样推断的原理,根据样本观察资料对所作假设进行检验,来判断这种假设的真伪,以决作假设进行检验,来判断这种假设的真伪,以决定我们行动的取舍。定我们行动的取舍。1 1)总体和样本)
3、总体和样本2 2)参数和统计量)参数和统计量3 3)样本容量和样本个数)样本容量和样本个数4 4)重复抽样和不重复抽样)重复抽样和不重复抽样5 5)抽样误差抽样误差登记性误 差系统偏差抽样误 差代表性误差统计(调查)误差 1、概念:概念:。 登记性误差登记性误差是所有统计调查都可能发生的,而是所有统计调查都可能发生的,而抽样误差抽样误差不是由于调查失误所引起的,它是随机抽不是由于调查失误所引起的,它是随机抽样所特有的误差。样所特有的误差。 系统偏误是由于违反抽样随机原则,系统偏误是由于违反抽样随机原则,有意地抽有意地抽选较好或较差的单位进行调查,这种系统性原选较好或较差的单位进行调查,这种系统
4、性原因造成的样本代表性不足所引起的误差。因造成的样本代表性不足所引起的误差。 系统偏误和登记误差系统偏误和登记误差都属于思想、作风、技术都属于思想、作风、技术问题,问题,可以防止和避免可以防止和避免,而,而抽样误差则是不可抽样误差则是不可避免,难于消灭,只能加以控制。避免,难于消灭,只能加以控制。 总体各单位标志值的差异程度总体各单位标志值的差异程度。(差异程度越。(差异程度越大,抽样误差越大)大,抽样误差越大) 样本的单位数样本的单位数(样本单位数越多,抽样误差越(样本单位数越多,抽样误差越小)小) 抽样方法抽样方法(重复抽样的误差比不重复抽样的误(重复抽样的误差比不重复抽样的误差要大些)差
5、要大些) 抽样调查的组织形式抽样调查的组织形式(简单随机抽样、类型抽(简单随机抽样、类型抽样、等距抽样、整群抽样)样、等距抽样、整群抽样)(1)抽样实际误差:)抽样实际误差:指某一次具体抽样中,样本指标值与总体参数真实值之间的偏差。(2)抽样平均误差:即通常所说的抽样误差,)抽样平均误差:即通常所说的抽样误差,也称抽样标准误。也称抽样标准误。(3)抽样极限)抽样极限/允许误差允许误差:样本平均数与总体平均数的差额样本平均数与总体平均数的差额X样本成数与总体成数的差额样本成数与总体成数的差额pP 抽样平均误差抽样平均误差是指所有可能的样本指标与总是指所有可能的样本指标与总体指标之间的平均差异程度
6、,是反映抽样误差体指标之间的平均差异程度,是反映抽样误差的一般水平的指标。的一般水平的指标。 用用样本平均数的标准差样本平均数的标准差或或样本成数的标准差样本成数的标准差来作为衡量其抽样误差一般水平的尺度。来作为衡量其抽样误差一般水平的尺度。是样本个数)()(22MMpPMXPX 重复抽样的条件下:重复抽样的条件下:样本容量总体标准差、nnX不重复抽样条件下:不重复抽样条件下:NnnNNNNNnNnXX11很大的时候,当为总体单位数、)1(22样本成数的抽样平均误差表明各样本成数和总体样本成数的抽样平均误差表明各样本成数和总体成数绝对离差的一般水平。成数绝对离差的一般水平。在重复抽样的条件下:
7、在重复抽样的条件下:样本单位数总体成数、)1(npnppP)1()1(很大时,当)1()1(NnnppNNnNnppPP某钢铁厂生产某种钢管,现从该厂某月生产的某钢铁厂生产某种钢管,现从该厂某月生产的500500根根产品中抽取一个容量为产品中抽取一个容量为100100根的样本。已知一级品根的样本。已知一级品率为率为60%60%,试求样本一级品率的抽样平均误差。,试求样本一级品率的抽样平均误差。解:已知解:已知p=60% p=60% 、n=100n=100、N=500N=500%9.4100%601%60)1(重复抽样下:nppP%4.4)5001001(100%)601(%6011不重复抽样下
8、:NnnppP抽样极限误差抽样极限误差是指一定概率下抽样误差的可能范围抽样误差的可能范围,说明样本估计量在总体参数周围变动的范围,记作。设待定的总体参数是,用以估计该参数的统计量是 ,抽样估计的极限误差是 ,即 这个极限误差是根据研究对象的变异程度和分析任务的性质来确定的允许误差范围。PPXXPXPpPXXpPX公式变形:样本成数极限误差:样本平均数极限误差:称为成数置信区间,区间称为平均数置信区间,区间PPXXPPXX1 1、参数估计的概念参数估计的概念:从总体中抽取一部分单位进行调:从总体中抽取一部分单位进行调查,进而利用样本提供的信息来推断总体的未知参查,进而利用样本提供的信息来推断总体
9、的未知参数和数值特征的方法和过程。数和数值特征的方法和过程。2 2、参数估计包括的内容:、参数估计包括的内容: 确定估计值 确定估计的优良标准并加以判别 求估计值和被估计参数之间的误差范围 计算在一定误差范围内所作推断的可靠程度等3 3、参数估计的两种形式、参数估计的两种形式:点估计点估计和和区间估计区间估计点估计以样本指标直接估计总体参数。评价准则的数学期望等于总体参数,即E该估计量称为无偏估计。无偏性有效性当 为 的无偏估计时, 方差 越小,无偏估计越有效。2)(E一致性对于无限总体,如果对任意01)|(|PLimn则称的一致估计。是估计量常用的点估计量PpSX 优点优点:简便、易行、原理
10、直观:简便、易行、原理直观 缺点缺点:这种估计没有表明抽样估计的误差,更:这种估计没有表明抽样估计的误差,更没有指出误差在一定范围内的概率保证程度有没有指出误差在一定范围内的概率保证程度有多大。多大。 一、区间估计的含义 二、总体均值的区间估计 三、总体成数的区间估计 四、正态总体方差的区间估计1)(21P估计值、抽样误差范围、概率保证程度(置信度)估计值、抽样误差范围、概率保证程度(置信度) 抽样误差范围决定估计的抽样误差范围决定估计的,概率保证程,概率保证程度决定估计的度决定估计的可靠性可靠性。抽样误差范围越大,精确度越低,反之就越高;抽样误差范围越大,精确度越低,反之就越高;概率保证程度
11、越大,可靠性越高,反之就越低。概率保证程度越大,可靠性越高,反之就越低。 在抽样估计时,希望精度高些,可靠性大些,在抽样估计时,希望精度高些,可靠性大些,但两者同时实现是有矛盾的。但两者同时实现是有矛盾的。 区间估计估计未知参数所在的可能的区间。评价准则随机区间置信度精确度随机区间1)(ULP),(UL包含(即可靠程度)越大越好。的概率),(UL的平均长度(误差范围)越小越好),(LUE一般形式)()(或总体参数估计值误差范围 :一定倍数的抽样误差nZx2例如:抽样误差 n/一定时,2Z越大,x概率(可靠性)越大;随之增大,精确度就差。 根据已经给定的抽样误差范围,求概率保证程度。根据已经给定
12、的抽样误差范围,求概率保证程度。步骤:步骤:抽取样本,计算样本指标抽取样本,计算样本指标计算标准差、抽样计算标准差、抽样平均误差平均误差结合结合给定的抽样误差范围,求出给定的抽样误差范围,求出z z值值 根据根据z z值查表得值查表得F F(z z) 根据给定的置信度要求,来推算抽样极限误差的可能范围根据给定的置信度要求,来推算抽样极限误差的可能范围步骤:步骤:抽取样本,计算样本指标抽取样本,计算样本指标计算标准差,抽样平均计算标准差,抽样平均误差误差根据根据F F(z z)查出)查出z z值值计算极限误差计算极限误差求出求出估计总体指标的上下限,作区间估计估计总体指标的上下限,作区间估计1.
13、总体方差已知时总体方差已知时 当 , )时,来自该总体的简单随机样本 的样本均值 服从数学期望为 、方差 为 的正态分布,将样本均值统计量 标准化,得到 统计量: 根据区间估计的定义,在给定的显著性水平 下,总体均值在 1-的置信度下的置信区间为: ( , ),即 其中, 即抽样平均误差 , 即抽样允许误差。( NX2nxxx,21n/2X)1 ,0(/NnxZZnZX2/nZX2/XXXX)(xnnZ2/XX 例例 某厂生产的零件长度服从正态分布,从该厂生产的零件中随机抽取25件,测得它们的平均长度为30.2厘米。已知总体标准差 =0.45厘米。 要求:要求:(1)计算抽样平均误差和抽样允许
14、误差。 (2)估计零件平均长度的可能范围( =0.05)。 已知已知: , ), =30.2, =25, 1- =0.95,( NX245. 0Xn (1)抽样平均误差 查标准正态分布表可知在 =0.05时, =1.96,所以,抽样允许误差 (2)总体均值的置信区间为: ( , )= =( , )= (30.02,30.38) 即我们可以以95%的概率保证该厂零件平均长度在30.02厘米到30.38厘米之间。 09. 02545. 0)(nx2/Z1764. 009. 096. 12/nZxnZX2/nZX2/),(XXXX1764. 02 .301764. 02 .30*总体服从正态分布,但
15、总体服从正态分布,但总体方差 未知,可以以样本方差 代替,但新的统计量不服从标准正态分布,而是服从自由度为 n1的 t 分布。 *给定置信度1 ,可查 t 分布表确定临界值 从而总体均值的置信区间为: ( , ) 其中, 即为抽样平均误差; 即为抽样允许误差。上式也可表示为: 22S) 1(2/ntnSntX12/nSntX12/)(XnSnSnt12/XXXXX 例例 从某市高中生中按不重复抽样方法随机抽取25名调查每周收看电视的时间,分组资料见表7-2。 表7-2 每周看电视时间 要求:要求:(1)计算抽样平均误差和抽样允许误差; (2)估计该市全体高中生每周平均看电视时间的置信区间(给定
16、的显著性水平为0.05)。已知:已知: =25, =0.05, N远大于n,不重复抽样可按重复抽样处理样本均值 样本方差 =4.33 查 分布表知 =0.05时,临界值 = =2.0639,因此, 抽样平均误差 抽样允许误差n)小时( 5251987856321x2415)-(98)5-7(8)5-5(6)5-3(25)-(1222222s) 1(2/nt) 125(025. 0t416.02533.4)(nSX859.0416.00639.22/nStXt总体均值置信度为95%的置信区间为:( , ) = =(5-0.859,5+0.859)=(4.14,5.86) 即我们可以以95%的把握
17、保证该市高中生每周平均看电视时间在4.14到5.86小时之间。 nStX2/nStX2/),(XXXX *在大样本下,样本比例的分布趋近于均值为p 、方差为 的正态分布。因此,给定置信度1 ,查正态分布 表得 ,则样本比例的抽样极限误差为: 所以,总体比例的置信度为1 的置信区间为: npp)1(2/Z)(2/pZppppPp 例例 某厂对一批产成品按不重复抽样方法随机抽选200件进行质量检测,其中一等品160件,试以90%的概率估计一等品率的范围。 已知已知: ,1- =90%, =200 查表知: =1.645 计算得样本比例的抽样平均误差为: 抽样极限误差为: 所以,该批产品的一等品比例
18、的置信区间为: 即这批产品的一等品率在75.35% 到84.66% 之间。%80200160pn2/Z%83.2200%)801 (%80)1 ()(nppp%655. 4%83. 2645. 1)(2/pZp%655. 4%80%655. 4%80P 1.大样本情况下,样本标准差S的分布近似服从正态分布 ,所以,总体标准差的置信度为1- 的置信区间近似为: ( ) 2.小样本情况下,若总体呈正态分布且其均值和方差未知,则总体方差的置信区间可由如下统计量的分布来确定: 总体方差的置信度为1- 的置信区间为: ( , ) )2/,(2nNnSZSnSZS2,22/2/)1()1(2222nSn)
19、1()1(22/2nSn)1()1(22/12nSn 例例 从某班学生中随机抽取16人,计算得语文平均成绩为75分,方差为25分。假定学生成绩服从正态分布,试求总体方差及标准差的置信区间(给定的显著性水平为0.05)。 解解:已知n=25, =0.05,查 分布表确定两个临界值: = = 将临界值数字带入上述公式中,总体方差和标准差的置信度为1-的置信区间分别为:( , ),即为(13.64,59.89); ( , ),即为(3.69,7.74)。 2) 1(2/12n262. 6) 116(975. 02) 1(2/2n488.27) 116(025. 02488.2725)116(262.
展开阅读全文