第7章-参数估计PPT课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第7章-参数估计PPT课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 参数估计 PPT 课件
- 资源描述:
-
1、第七章参数估计第七章参数估计大学生每周上网花多少时间?大学生每周上网花多少时间?回答类别回答类别人数(人)人数(人)频率(频率(%)3小时以下小时以下321636小时小时3517.569小时小时3316.5912小时小时2914.512小时以上小时以上7135.5合计合计200100 平均上网时间为平均上网时间为8.58小时,标准差为小时,标准差为0.69小时。全校学生小时。全校学生每周的平均上网时间是多少?每周上网时间在每周的平均上网时间是多少?每周上网时间在12小时以上小时以上的学生比例是多少?你做出估计的理论依据是什么?的学生比例是多少?你做出估计的理论依据是什么?学习目标学习目标1、掌
2、握参数估计的基本方法和原理。、掌握参数估计的基本方法和原理。2、理解并掌握置信区间和置信水平的、理解并掌握置信区间和置信水平的含义。含义。3、理解并掌握评价估计量的标准。、理解并掌握评价估计量的标准。4、掌握一个总体参数的区间估计方法,、掌握一个总体参数的区间估计方法,了解两个总体参数区间估计的基本了解两个总体参数区间估计的基本方法。方法。5、掌握估计一个总体均值和总体比例、掌握估计一个总体均值和总体比例时样本量的确定方法。时样本量的确定方法。1.参数估计:总体分布类型已知,仅需对分布参数估计:总体分布类型已知,仅需对分布 的未知参数进行的估计的未知参数进行的估计2.估计量:用于估计总体参数的
3、随机变量估计量:用于估计总体参数的随机变量u如样本均值,样本比例、样本方差等如样本均值,样本比例、样本方差等例如例如: 样本均值就是总体均值样本均值就是总体均值 的一个估计量的一个估计量3.估计值:估计参数时计算出来的统计量的具体值估计值:估计参数时计算出来的统计量的具体值u如果样本均值如果样本均值 x =80,则,则80就是就是 的估计值的估计值4.参数用参数用 表示,估计量表示,估计量用用 表示表示一、一、 参数估计的一般问题参数估计的一般问题表示表示用用估计量估计量 参数估计的方法参数估计的方法估估 计计 方方 法法点点 估估 计计区间估计区间估计点估计点估计 (point estima
4、te)用样本的估计量的某个取值直接作为总体参数用样本的估计量的某个取值直接作为总体参数的估计值的估计值例如:用样本均值直接作为总体均值的估计;用例如:用样本均值直接作为总体均值的估计;用两个样本均值之差直接作为总体均值之差的估计两个样本均值之差直接作为总体均值之差的估计无法给出估计值接近总体参数程度的信息无法给出估计值接近总体参数程度的信息l虽然在重复抽样条件下,点估计的均值可望等于虽然在重复抽样条件下,点估计的均值可望等于总体真值,但由于样本是随机的,抽出一个具体总体真值,但由于样本是随机的,抽出一个具体的样本得到的估计值很可能不同于总体真值的样本得到的估计值很可能不同于总体真值l一个点估计
5、量的可靠性是由它的抽样标准误差来一个点估计量的可靠性是由它的抽样标准误差来衡量的,这表明一个具体的点估计值无法给出估衡量的,这表明一个具体的点估计值无法给出估计的可靠性的度量计的可靠性的度量 二战期间,盟军非常想知道德军总共制造了多少辆坦克。德国二战期间,盟军非常想知道德军总共制造了多少辆坦克。德国人在制造坦克时是墨守成规的,他们把坦克从人在制造坦克时是墨守成规的,他们把坦克从1开始进行了连开始进行了连续编号。在战争过程中,盟军缴获了一些敌军坦克,并记录了续编号。在战争过程中,盟军缴获了一些敌军坦克,并记录了它们的生产编号。那么怎样利用这些号码来估计坦克总数呢?它们的生产编号。那么怎样利用这些
6、号码来估计坦克总数呢?在这个问题中,总体参数是未知的坦克总数在这个问题中,总体参数是未知的坦克总数N,而缴获坦克的编而缴获坦克的编号则是样本。制造出来的坦克总数肯定大于等于记录的最大编号则是样本。制造出来的坦克总数肯定大于等于记录的最大编号。为了找到它比最大编号大多少,我们先找到被缴获坦克编号。为了找到它比最大编号大多少,我们先找到被缴获坦克编号的平均值,并认为这个值是全部编号的中点。因此样本均值号的平均值,并认为这个值是全部编号的中点。因此样本均值乘以乘以2就是总数的一个估计;当然要特别假设缴获的坦克代表就是总数的一个估计;当然要特别假设缴获的坦克代表了所有坦克的一个随机样本。这种估计了所有
7、坦克的一个随机样本。这种估计N的公式的缺点是:不的公式的缺点是:不能保证均值的能保证均值的2倍一定大于记录中的最大编号。倍一定大于记录中的最大编号。N的另一个点估计公式是:用观测到的最大编号乘以因的另一个点估计公式是:用观测到的最大编号乘以因子子1+1/n,其中,其中 n 是被俘虏坦克个数。假如你俘虏了是被俘虏坦克个数。假如你俘虏了10 辆坦克,其中最大编号是辆坦克,其中最大编号是50,那么坦克总数的一个估,那么坦克总数的一个估计是(计是(1+1/10) 50=55。此处我们认为坦克的实际数略。此处我们认为坦克的实际数略大于最大编号。大于最大编号。从战后发现的德军记录来看,盟军的估计值非常接近
8、从战后发现的德军记录来看,盟军的估计值非常接近所生产的坦克的真实值。记录仍然表明统计估计比通所生产的坦克的真实值。记录仍然表明统计估计比通常通过其他情报方式作出估计要大大接近于真实数目常通过其他情报方式作出估计要大大接近于真实数目。统计学家们做得比间谍们更漂亮!。统计学家们做得比间谍们更漂亮!资料来源:资料来源:GUDMUND R.IVERSEN和和MARY GERGRN著,吴喜之等译:著,吴喜之等译:统计学统计学基本概念和基本概念和方法方法,高等教育出版社,施普林格出版社,高等教育出版社,施普林格出版社,2000。点估计量的常用评价准则:无偏性无偏性l无偏性:估计量的数学期望与总体待估参数的
9、真值相等:( )E有偏有偏点估计量的常用评价准则: 有效性l 在两个无偏估计量中方差较小的估计量较为有效。 的抽样分布的抽样分布 的抽样分布的抽样分布12估计量的常用评价准则:一致性l指随着样本容量的增大,估计量越来越接近被估计的总体参数。较小的样本容量较小的样本容量较大的样本容量较大的样本容量P(X )区间估计l根据事先确定的置信度1 - 给出总体参数的一个估计范围。l置信度1 - 的含义是:在同样的方法得到的所有置信区间中,有100(1- )% 的区间包含总体参数。 l抽样分布是区间估计的理论基础。估计值估计值(点估计点估计)置信下限置信下限置信上限置信上限置信区间置信区间置信区间的表述置
10、信区间的表述 (95%的置信区间的置信区间) 我没有抓住参数!我没有抓住参数!二、一个总体参数的区间估计二、一个总体参数的区间估计总体参数总体参数符号表示符号表示样本统计样本统计量量均值均值比例比例方差方差2xp2s(一)总体均值的区间估计(一)总体均值的区间估计总体均值区间的一般表达式:总体均值的置信区间是由样本均值加减估计误差得到的估计误差由两部分组成:一是点估计量的标准误差,它取决于样本统计量的抽样分布。二是估计时所要的求置信水平为时,统计量分布两侧面积为的分位数值,它取决于事先所要求的可靠程度总体均值在置信水平下的置信区间可一般性地表达为 样本均值样本均值分位数值分位数值样本均值的标准
11、误差样本均值的标准误差相关理论总体正态总体正态?n30?2 2已已知知?否是是否否是实际中总体方差总是未知的,因实际中总体方差总是未知的,因而这是应用最多的公式。在大样而这是应用最多的公式。在大样本时本时t值可以用值可以用z值来近似。值来近似。根据中心极限定理得根据中心极限定理得到的近似结果。到的近似结果。 未知时用未知时用s来估计。来估计。nZx 2 nstx2 nZx 2 增大增大n?数学?数学变换变换?Example:用用SPSS进行进行总体均值总体均值区间估计区间估计l例:儿童电视节目的赞助商希望了解儿童每周看电例:儿童电视节目的赞助商希望了解儿童每周看电视的时间。下面是对视的时间。下
12、面是对100名儿童进行随机调查的结名儿童进行随机调查的结果(小时)。计算平均看电视时间果(小时)。计算平均看电视时间95%的置信区间。的置信区间。39.719.534.727.041.315.120.531.318.317.021.529.915.016.436.823.424.128.923.424.440.646.423.639.435.519.529.331.220.634.915.531.638.938.727.226.514.715.628.424.043.920.629.19.521.042.413.932.829.832.933.038.028.720.619.738.637.1
13、17.015.123.421.021.829.321.322.823.432.511.343.830.815.823.220.333.530.037.824.426.929.027.727.122.036.123.022.126.522.926.930.225.223.835.321.635.730.822.724.521.926.550.3总体均值的区间估计总体均值的区间估计(例题分析例题分析)总体均值总体均值 在在1- 置信水平下的置信区间为置信水平下的置信区间为96. 1z95%,-100,1n8.37284,s27.191,x:/2 解解 )85.28,53.25(1037284. 8
14、96. 1191.272/ nSX 儿童每周看电视的平均时间的儿童每周看电视的平均时间的SPSS输出结果(数据:输出结果(数据:tv.xls)操作:分析操作:分析-描述统计描述统计-探索探索统计量标准误均值27.191.8373均值的 95% 置信区间下限25.530上限28.8525% 修整均值26.977中值26.500方差70.104标准差8.3728极小值9.5极大值50.3(二)总体比例的区间估计(二)总体比例的区间估计1.假定条件l总体服从二项分布l可以由正态分布来近似lnp(成功次数)和n(1-p)(失败次数)均应该大于52. 使用正态分布统计量 zN(0,1)n)(1pz 3.
15、 总体比例总体比例 在在1- 置信水平下置信水平下的置信区间为的置信区间为nppzp)-1(2 样本比例样本比例分位数值分位数值样本比例的标准误差样本比例的标准误差总体比例的置信区间:例子总体比例的置信区间:例子解:显然有解:显然有因此可以用正态分布进行估计。因此可以用正态分布进行估计。 /2=1.6450215. 0217. 0995)217. 01(217. 0645. 1217. 0)1(2 nppZp 结论:我们有90的把握认为悉尼青少年中每天都抽烟的青少年比例在19.55%23.85%之间。19861986年对悉尼年对悉尼995995名青少年的名青少年的随机调查发现随机调查发现,有,
16、有216216人每天人每天都抽烟。试估都抽烟。试估计悉尼青少年计悉尼青少年中每天都抽烟中每天都抽烟的青少年比例的青少年比例的的90%90%的置信区的置信区间。间。5)1(, 5 pnpnSPSS的计算结果的计算结果l在SPSS中将“是否吸烟”输入为取值为1和0的属性变量,权数分别为216和779。计算这一变量均值的置信区间即为比例的置信区间。统计量标准误均值.2171.01308均值的 90% 置信区间下限.1956上限.23865% 修整均值.1857中值.0000方差.170标准差.41247极小值.00极大值1.00范围1.00四分位距.00(三)总体方差的区间估计(三)总体方差的区间估
17、计1.估计一个总体的方差或标准差估计一个总体的方差或标准差2.假设总体服从正态分布假设总体服从正态分布3. 总体方差总体方差 2 的点估计量为的点估计量为s2,且且4. 总体方差在总体方差在1- 置信水平下的置信区间为置信水平下的置信区间为 ) ) ) )11222 nsn ) ) ) )2212222211 snsn总体方差的区间估计总体方差的区间估计(图示图示)总体方差的区间估计总体方差的区间估计(例题分析例题分析)【例】【例】一家食品生产企业以生产袋装食品为主,现从某一家食品生产企业以生产袋装食品为主,现从某天生产的一批食品中随机抽取了天生产的一批食品中随机抽取了25袋,测得每袋重量如袋
18、,测得每袋重量如下表所示。已知产品重量的分布服从正态分布。以下表所示。已知产品重量的分布服从正态分布。以95%的置信水平建立该种食品重量方差的置信区间的置信水平建立该种食品重量方差的置信区间 25袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3总体方差的区间估计总体方差的区间估计(例题分析例题分析)解解:已知已知n25,1- 95% ,根据样本数据计算得根据样本数据计算
19、得 s2 =93.21 2置信度为置信度为95%的置信区间为的置信区间为 4011.12)24()1(2975. 0212 n3641.39)24()1(2025. 022 n ) ) ) )39.18083.564011.1221.931253641.3921.9312522 该企业生产的食品总体重量标准差的该企业生产的食品总体重量标准差的95%置信区置信区间为间为7.54g13.43g均值均值比例比例方差方差大样本大样本小样本小样本大样本大样本 2 2分布分布 2 2已知已知 2 2已知已知Z Z分布分布 2 2未知未知Z Z分布分布Z Z分布分布Z Z分布分布 2 2未知未知t t分布分
20、布一个总体参数的区间估计一个总体参数的区间估计(小结小结)三、两个总体参数的区间估计三、两个总体参数的区间估计总体参数总体参数符号表示符号表示样本统计量样本统计量均值差比例差方差比2121222121xx 21pp 2221ss(一)均值之差区间的一般表达式(一)均值之差区间的一般表达式两个总体均值的置信区间是由两个样本均值之差加减估计误差得到的估计误差由两部分组成:一是点估计量的标准误差,它取决于样本统计量的抽样分布。二是估计时所要的求置信水平为时,统计量分布两侧面积为的分位数值,它取决于事先所要求的可靠程度两个总体均值之差(1-2)在置信水平下的置信区间可一般性地表达为 ( x1- x2
21、)分位数值分位数值 ( x1- x2 )的标准误差的标准误差两个总体均值之差的估计两个总体均值之差的估计(独立大样本独立大样本)1. 假定条件假定条件两个两个总体都服从正态分布,总体都服从正态分布, 1、 2已知已知若不是正态分布若不是正态分布, 可以用正态分布来近似可以用正态分布来近似(n1 30和和n2 30)两个样本是独立的随机样本两个样本是独立的随机样本2. 使用正态分布统计量使用正态分布统计量 z)1 , 0()()(2221212121Nnnxxz 两个总体均值之差的估计两个总体均值之差的估计 (大样本大样本)1. 1, 2已知时,已知时,两个总体均值之差两个总体均值之差 1- 2
22、在在1- 置信水平下的置信区间为置信水平下的置信区间为222121221)(nnzxx 222121221)(nsnszxx 1、 2未知时,未知时,两个总体均值之差两个总体均值之差 1- 2在在1- 置信水平下的置信区间为置信水平下的置信区间为两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)【例】【例】某地区教育管理某地区教育管理部门想估计两所中学的部门想估计两所中学的学生高考时的英语平均学生高考时的英语平均分数之差,为此在两所分数之差,为此在两所中学独立抽取两个随机中学独立抽取两个随机样本,有关数据如右表样本,有关数据如右表 。建立两所中学高考英。建立两所中学高考英语平均分
展开阅读全文