第六章参数估计课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第六章参数估计课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第六 参数估计 课件
- 资源描述:
-
1、第五章第五章 参数估计参数估计第一节第一节 参数估计基本方法参数估计基本方法第二节第二节 总体均值和总体比例的区间估计总体均值和总体比例的区间估计第一节参数估计的基本方法第一节参数估计的基本方法v推断统计就是根据抽样分布的原理进行的。推断统计就是根据抽样分布的原理进行的。v推断统计分为两大类:推断统计分为两大类:v参数估计:参数估计:根据一个随机样本的统计值来估计总体根据一个随机样本的统计值来估计总体之参数值是多少。先看样本情况,再推总体情况。之参数值是多少。先看样本情况,再推总体情况。v假设检验:假设检验:首先假设总体的情况是怎样的,然后以首先假设总体的情况是怎样的,然后以一个随机样本的统计
2、值来检验这个假设是否正确一个随机样本的统计值来检验这个假设是否正确。第一节参数估计的基本方法第一节参数估计的基本方法v只要采用随机抽样法,就可根据抽样分布,以样本只要采用随机抽样法,就可根据抽样分布,以样本统计值来推测总体情况。统计值来推测总体情况。即根据一个随机样本的统即根据一个随机样本的统计值来估计总体参数是多少。计值来估计总体参数是多少。 参数估计方法:参数估计方法:1.1.点估计:以一个最适当的样本统计值来代表总体点估计:以一个最适当的样本统计值来代表总体的参数值;的参数值;2.2.区间估计:以一个区间去估计总体参数值区间估计:以一个区间去估计总体参数值;一、点估计一、点估计从总体中抽
3、取一个样本,根据该样本的统计量对总体的未从总体中抽取一个样本,根据该样本的统计量对总体的未知参数作出一个数值点的估计,用于估计总体某一参数的知参数作出一个数值点的估计,用于估计总体某一参数的随机变量;随机变量;例如例如: : 用样本均值作为总体未知均值的估计值就是一用样本均值作为总体未知均值的估计值就是一 个个点估计。点估计。样本越大,抽样方法越严谨,点估计越可信样本越大,抽样方法越严谨,点估计越可信。点估计的缺陷点估计的缺陷 抽样误差总是难免的。抽样误差总是难免的。 点估计没给出估计值接近总体未知点估计没给出估计值接近总体未知参数程度的信息,即估计的可信程度很参数程度的信息,即估计的可信程度
4、很难确定。难确定。二、区间估计二、区间估计1.1.根据一个样本的观察值给出总体参数的估计范围根据一个样本的观察值给出总体参数的估计范围2.2.给出总体参数落在这一区间的概率给出总体参数落在这一区间的概率3.3.例如例如: : 总体均值落在总体均值落在50705070之间,可信度为之间,可信度为 95%95%1.1.总体未知参数落在某区间内的概率总体未知参数落在某区间内的概率2.2.表示为表示为 (1 - 100100为为显著性水平显著性水平,是总体参数,是总体参数未在未在区间内的概率区间内的概率3.3.常用的可信度值有常用的可信度值有 99%, 95%99%, 95%;相应;相应的的 为为0.
5、010.01,0.050.05。可信度(置信水平)可信度(置信水平) 正态分布落在总体均值某一区间正态分布落在总体均值某一区间内的样本内的样本XX总体均值的间距估计总体均值的间距估计假定条件假定条件总体服从正态分布总体服从正态分布, ,且总体方差(且总体方差( )已知已知如果不是正态分布,可以由正态分布来近似如果不是正态分布,可以由正态分布来近似 ( (n n 30)30)均值的间距估计均值的间距估计v可用下面公式计算可用下面公式计算可信间距可信间距:v当可信度为当可信度为9999时,时,Z Z取取2.582.58v间距的大小与可信度成正比间距的大小与可信度成正比v不难理解:在估计时所用不难理
6、解:在估计时所用 的间距如果很小,错误的间距如果很小,错误的机会当然较大,可信度自然较低。的机会当然较大,可信度自然较低。v应用间距估计法时,可以选用任意的可应用间距估计法时,可以选用任意的可信度,但一般用信度,但一般用9595或或9999。总体均值的间距估计总体均值的间距估计某行业职工日工资收入服从正态分布,从该行业职工中随机抽某行业职工日工资收入服从正态分布,从该行业职工中随机抽取人,测得其平均日工资收入为取人,测得其平均日工资收入为21.4 21.4 元。已知总体标准元。已知总体标准差差 =0.15=0.15元,试估计建立该行业职工日均收入的置信区间元,试估计建立该行业职工日均收入的置信
7、区间,给定置信水平为,给定置信水平为0.950.95。v均值抽样分布的标准差,称为均值的标准误:计算均值抽样分布的标准差,称为均值的标准误:计算方法是用总体的标准差除以样本大小方法是用总体的标准差除以样本大小(n)(n)的的平方的的平方根。根。v然而,总体的标准差很难知道,如果样本相当大,然而,总体的标准差很难知道,如果样本相当大,通常以样本的标准差通常以样本的标准差 S S 作为总体的标准差作为总体的标准差。但。但是,这种做法有将实际的标准误估计得稍偏。因为是,这种做法有将实际的标准误估计得稍偏。因为样本标准差倾向稍小于总体标准差。为弥补这个差样本标准差倾向稍小于总体标准差。为弥补这个差异,
8、在计算样本标准差时,除以异,在计算样本标准差时,除以n-1n-1而不是而不是n n。这样。这样就可以得到总体方差和标准差的无偏估计。就可以得到总体方差和标准差的无偏估计。v此处的此处的“n-1”称为称为“自由度自由度”。 第一,自由度的产生是与抽样分布联系在一起的第一,自由度的产生是与抽样分布联系在一起的。因为从总体中抽取样本,因而我们需要计算样。因为从总体中抽取样本,因而我们需要计算样本的本的“统计量统计量”,“统计量统计量”是研究者通过调查是研究者通过调查样本数据人为地计算出来的,而样本数据人为地计算出来的,而“参数参数”是被调是被调查者的总体所客观存在的,这是两者的区别。在查者的总体所客
9、观存在的,这是两者的区别。在统计学的理论层面上,要求统计量是参数的无偏统计学的理论层面上,要求统计量是参数的无偏估计,认为两者是相等的。在实际研究中,由于估计,认为两者是相等的。在实际研究中,由于抽样的误差可能导致两者的不相等,但对于这种抽样的误差可能导致两者的不相等,但对于这种情况,研究者是无法知道的,否则就没有抽样的情况,研究者是无法知道的,否则就没有抽样的必要了。在理论假设下,统计量和参数一样被看必要了。在理论假设下,统计量和参数一样被看作是客观的、确定性的。作是客观的、确定性的。 第二,既然在理论上统计量被要求是确定的第二,既然在理论上统计量被要求是确定的,那么在实际层面上计算统计量的
10、那组数,那么在实际层面上计算统计量的那组数据就不是完全自由的。这一点很重要,因据就不是完全自由的。这一点很重要,因为为“自由度自由度”中中“自由自由”的含义就是相对的含义就是相对这个这个“确定确定”而言的。正是统计量的这个而言的。正是统计量的这个“确定性确定性”限制了与之相关的一组数据的限制了与之相关的一组数据的“自由度自由度”,也就是说,一组数据不是可,也就是说,一组数据不是可以完全自由取值的,它必须支持以完全自由取值的,它必须支持“统计量统计量与总体参数相等与总体参数相等”的理论假设。这就是的理论假设。这就是“自由度自由度”存在的理由。存在的理由。 研究者对某一社区内居民家庭的收入状况进行
11、调研究者对某一社区内居民家庭的收入状况进行调查,该社区共有查,该社区共有10001000户,采取随机抽取的方式户,采取随机抽取的方式对对100100户进行了调查。在这个例子中,总体户进行了调查。在这个例子中,总体10001000户的收入的平均数是总体参数,是客观的户的收入的平均数是总体参数,是客观的、确定的,尽管研究者不知道。通过随机抽样、确定的,尽管研究者不知道。通过随机抽样和入户问卷调查,研究者获得了和入户问卷调查,研究者获得了100100户的收入户的收入数据。运用这组数据可以算出样本的平均数,数据。运用这组数据可以算出样本的平均数,它是统计量。由于在理论上要求统计量与参数它是统计量。由于
12、在理论上要求统计量与参数相等。当相等。当9999个数据被选择以后,第个数据被选择以后,第100100个数据个数据就是确定的,所以,这组数据在求平均数这统就是确定的,所以,这组数据在求平均数这统计量时的自由度就是计量时的自由度就是:k=100-1=99:k=100-1=99。t t分布分布v以均值标准误的估计以均值标准误的估计 作为分母计算的值作为分母计算的值,不完全符合,不完全符合Z Z分布或者说标准正态分布,我分布或者说标准正态分布,我们给这个分布起个名字,叫做们给这个分布起个名字,叫做t t分布。分布。vt t值符合值符合t t分布。分布。n-1n-1被称作自由度,自由度不被称作自由度,自
13、由度不同同t t分布的形状有差异。随着样本规模增大,分布的形状有差异。随着样本规模增大,也就是自由度的增大,也就是自由度的增大,t t分布会变得更加近似分布会变得更加近似于标准正态分布。于标准正态分布。总体均值的间距估计总体均值的间距估计v例题:例题:v我们欲了解某地区家庭用于请客送礼的每月我们欲了解某地区家庭用于请客送礼的每月平均支出(平均支出( )情况)情况, ,现从该地区抽取一个现从该地区抽取一个样本是:样本是:n n226226户,户, 4343元,元,S S10.510.5。则可信度为则可信度为9595的间距估计值为?的间距估计值为?v 41.63 M44.3741.63 M44.3
14、7v当可信度为当可信度为9999时的间距估计值是多少?时的间距估计值是多少?影响可信间距宽度的因素:影响可信间距宽度的因素:数据的离散程度,用数据的离散程度,用 来测度来测度;样本容量样本容量n n;置信水平置信水平 (1 - ) ,影响影响 Z Z 的取值。的取值。算例算例1 1v某大学从该校学生中随机抽取某大学从该校学生中随机抽取100100人,调查到人,调查到他们平均每天参加体育锻炼的时间为他们平均每天参加体育锻炼的时间为2626分钟。分钟。试以试以9595的置信水平估计该大学全体学生平的置信水平估计该大学全体学生平均每天参加体育锻炼的时间(已知总体方差均每天参加体育锻炼的时间(已知总体
15、方差为为3636分钟)分钟)算例算例2 2从一个正态总体中抽取一个随机样本,从一个正态总体中抽取一个随机样本, n n = 25 = 25 ,其均值,其均值 x = 50 ,标准差标准差 s s = 8 = 8。 建立总体均值建立总体均值m m 的的95%95%的置信区间。的置信区间。我们可以我们可以9595的概率保证总体均值在的概率保证总体均值在46.6946.6953.30 53.30 之间之间四、总体比例的间距估计四、总体比例的间距估计v我们要估计某城镇有多少家庭是不和睦的。现我们要估计某城镇有多少家庭是不和睦的。现一个随机样本(一个随机样本(n n100100)中知道有)中知道有20.
展开阅读全文