抽样与参数估计优质课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《抽样与参数估计优质课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样 参数估计 优质 课件
- 资源描述:
-
1、统计学统计学(第二版第二版)第章抽样与参数估计统计学统计学(第二版第二版)第第 5 章章 抽样与参数估计抽样与参数估计5.1 参数估计的一般问题参数估计的一般问题 5.2 抽样分布抽样分布5.3 一个总体参数的区间估计一个总体参数的区间估计5.4 样本容量的确定样本容量的确定统计学统计学(第二版第二版)学习目标学习目标估计量与估计值的概念估计量与估计值的概念点估计与区间估计的区别点估计与区间估计的区别评价估计量优良性的标准评价估计量优良性的标准一个总体参数的区间估计方法一个总体参数的区间估计方法样本容量的确定方法样本容量的确定方法统计学统计学(第二版第二版)参数估计在统计方法中的地位参数估计在
2、统计方法中的地位参数估计参数估计假设检验假设检验 统计方法统计方法描述统计描述统计推断统计推断统计统计学统计学(第二版第二版)统计推断的过程统计推断的过程统计学统计学(第二版第二版)5.1 参数估计的一般问题参数估计的一般问题估计量与估计值估计量与估计值抽样方法与样本可能数目抽样方法与样本可能数目点估计与区间估计点估计与区间估计统计学统计学(第二版第二版)估计量与估计值估计量与估计值统计学统计学(第二版第二版)估计量:用于估计总体参数的随机变量估计量:用于估计总体参数的随机变量如样本均值,样本比例、样本方差等如样本均值,样本比例、样本方差等例如例如:样本均值就是总体均值样本均值就是总体均值 的
3、一个估计量的一个估计量参数用参数用 表示,估计量表示,估计量用用 表示表示估计值:估计参数时计算出来的统计量的具估计值:估计参数时计算出来的统计量的具体值体值如果样本均值如果样本均值 x=80,则,则80就是就是 的估计值的估计值估计量与估计值估计量与估计值(estimator&estimated value)统计学统计学(第二版第二版)抽样方法与样本可能数目抽样方法与样本可能数目统计学统计学(第二版第二版)重复(置)抽样:重复(置)抽样:从总体中抽取样本时,随机抽取一个样本从总体中抽取样本时,随机抽取一个样本单位,记录该单位有关标志表现以后,把它放单位,记录该单位有关标志表现以后,把它放回到
4、总体中去,再从总体中随机抽取第二个单回到总体中去,再从总体中随机抽取第二个单位,位,照此下去直到抽选,照此下去直到抽选n个样本单位。个样本单位。抽样方法抽样方法统计学统计学(第二版第二版)不重复(置)抽样:不重复(置)抽样:从总体抽取第一个样本单位,记录该单从总体抽取第一个样本单位,记录该单位有关标志表现后,这个样本单位位有关标志表现后,这个样本单位不再放回不再放回总体中参加下一次抽选。然后,从总体总体中参加下一次抽选。然后,从总体N-1个个单位中随机抽选第二个样本单位,单位中随机抽选第二个样本单位,照,照此下去直到抽选出此下去直到抽选出n个样本单位。个样本单位。抽样方法抽样方法统计学统计学(
5、第二版第二版)是指从总体中可能抽取的样本的最多数是指从总体中可能抽取的样本的最多数目,抽样数目大小与抽样方法有关。目,抽样数目大小与抽样方法有关。nnNAN重复抽样时的样本可能数目是一个可重复的排列数:重复抽样时的样本可能数目是一个可重复的排列数:例:从例:从0-9的的10个数中随机重复抽选个数中随机重复抽选6个数字组成电个数字组成电话号码,共能组成多少个电话号码?话号码,共能组成多少个电话号码?610100nnNAN万样本可能数目:样本可能数目:统计学统计学(第二版第二版)考虑顺序时的样本可能数目是不重复的排列数:考虑顺序时的样本可能数目是不重复的排列数:(1)(2).(1)!/()!nNP
6、N NNNNNNn例:从班级例:从班级10位学生中抽选三人担任不同的职务位学生中抽选三人担任不同的职务,问共有几种抽法?,问共有几种抽法?(1)(2).(1)10*9*8720nNPN NNNN种不重复抽样时的样本可能数目可分为考虑顺序和不重复抽样时的样本可能数目可分为考虑顺序和不考虑顺序两种情况。不考虑顺序两种情况。统计学统计学(第二版第二版)不考虑顺序时的样本可能数目是不重复的组合数:不考虑顺序时的样本可能数目是不重复的组合数:(1)(2).(1)/!nnNNN NNNnCPnn例:从小组例:从小组10位学生中不重复随机抽选位学生中不重复随机抽选3个组成个组成样本,考查其平均成绩,可能的样
7、本数目为:样本,考查其平均成绩,可能的样本数目为:31010*9*87201203*2*16C种统计学统计学(第二版第二版)点估计与区间估计点估计与区间估计统计学统计学(第二版第二版)参数估计的方法参数估计的方法估估 计计 方方 法法点点 估估 计计区间估计区间估计统计学统计学(第二版第二版)估计总体均值时样本容量的确定当总体服从正态分布 XN(,2)时,来自该总体所有容量为n的样本均值 也服从正态分布,的数学期望为 ,方差为t分布与标准正态分布的比较解:已知N(,102),n=25,1-=95%,z/2=1.1 参数估计的一般问题总体方差未知时,可以用样本标准差作为总体标准差的点估计。无偏性
8、(unbiasedness)应抽取的样本容量为表示为(1-现用重复抽样方法从5人中随机抽取2人组成样本,样本可能数目为52=25个。一、重复抽样时样本平均数的分布根据上表数据,可以整理出样本平均数的分布如右表:解:已知=2000,E=400,1-=95%,z/2=1.总体均值的区间估计(大样本)例:从小组10位学生中不重复随机抽选3个组成样本,考查其平均成绩,可能的样本数目为:从以上计算,也可以得到两个重要结论:其中样本均值,样本比例和样本方差分别是总体均值、总体比例和总体方差的无偏估计量例:从小组10位学生中不重复随机抽选3个组成样本,考查其平均成绩,可能的样本数目为:根据样本日工资平均数分
9、布表,可以计算日工资平均数的数学期望和方差:20个样本的日平均工资计算如下表:点估计点估计(point estimate)用样本的估计量直接作为总体参数的估计用样本的估计量直接作为总体参数的估计值值例如:用样本均值直接例如:用样本均值直接作为作为总体均值的估计总体均值的估计例如:用两个样本均值之差直接例如:用两个样本均值之差直接作为作为总体均总体均值之差的估计值之差的估计2.没有给出估计值接近总体参数程度的信息没有给出估计值接近总体参数程度的信息统计学统计学(第二版第二版)区间估计区间估计(interval estimate)在点估计的基础上,给出总体参数估计的一个区间在点估计的基础上,给出总
10、体参数估计的一个区间范围,该区间由样本统计量加减范围,该区间由样本统计量加减抽样误差抽样误差而得到的而得到的根据样本统计量的抽样分布能够对样本统计量与总根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量体参数的接近程度给出一个概率度量比如,某班级平均分数在比如,某班级平均分数在7585之间,置信水平是之间,置信水平是95%统计学统计学(第二版第二版)区间估计的图示区间估计的图示统计学统计学(第二版第二版)区间估计的图示区间估计的图示XXzX2统计学统计学(第二版第二版)将构造置信区间的步骤重复很多次,置将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占
11、的信区间包含总体参数真值的次数所占的比例称为置信水平比例称为置信水平 表示为表示为(1-为是总体参数未在区间内的比例为是总体参数未在区间内的比例 常用的置信水平值有常用的置信水平值有 99%,95%,90%相应的相应的 为为0.01,0.05,0.10置信水平置信水平 统计学统计学(第二版第二版)由样本统计量所构造的总体参数的估计区间称由样本统计量所构造的总体参数的估计区间称为置信区间为置信区间统计学家在某种程度上确信这个区间会包含真统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间正的总体参数,所以给它取名为置信区间 用一个具体的样本所构造的区间是一个特定的用一个具
12、体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值否包含总体参数的真值我们只能是希望这个区间是大量包含总体参数真我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个含参数真值的区间中的一个置信区间置信区间(confidence interval)统计学统计学(第二版第二版)置信区间与置信水平置信区间与置信水平 xxX统计学统计学(第二版第二版)影响区间宽度的因素影响区间宽度的因素1.总体数据的离散程度,总体数据的离散
13、程度,用用 来测度来测度样本容量,样本容量,2.置信水平置信水平(1-),影响,影响 z 的大小的大小nX统计学统计学(第二版第二版)5.2 抽样分布抽样分布n 样本统计量是个随机变量,样本统计量是个随机变量,抽样分布就是样本抽样分布就是样本统计量的概率分布。统计量的概率分布。统计量的取值不但和样本容量有关,还和抽样方法统计量的取值不但和样本容量有关,还和抽样方法有关。下面我们主要讨论简单随机样本的抽样分布。有关。下面我们主要讨论简单随机样本的抽样分布。统计学统计学(第二版第二版)一、重复抽样时一、重复抽样时样本平均数的分布样本平均数的分布二、不重复抽样二、不重复抽样时样本平均数的分布时样本平
14、均数的分布三、样本比例的抽样分布三、样本比例的抽样分布四、关于正态分布的定理四、关于正态分布的定理(一)正态分布再生定理(一)正态分布再生定理(二)中心极限定理(二)中心极限定理5.2 抽样分布抽样分布统计学统计学(第二版第二版)其中称为边际误差,记为,也称为抽样极限误差。总体均值的区间估计(例题分析)统计量的取值不但和样本容量有关,还和抽样方法有关。(2)如果N很大,可以用N代替N-1,不重复抽样的平均误差计算公式就简化为:式中 的称为置信水平(confidence level),是指随机变量 的取值的绝对值小于 的概率。20个样本的日平均工资计算如下表:从以上计算,也可以得到两个重要结论:
15、式中总体比例未知时可以用样本比例p代替。,有更小标准差的估计量更有效考虑顺序的不重复抽样,样本可能数目为:这就是说,由样本均值构造的估计区间会以1-的概率涵盖总体均值,又可写为如下形式:这时,样本均值经过标准化后的随机变量服从t分布,即:与总体均值的区间估计类似,我们定义为样本比例的边际误差,于是,在(1-)置信水平下总体比例的置信区间为:估计量:用于估计总体参数的随机变量 -2 x一个总体参数的区间估计方法区间估计(interval estimate)例:设总体中共有n个总体单位,其中取值为1的单位数为n1个,取值为0的个体有n0个现用重复抽样方法从5人中随机抽取2人组成样本,样本可能数目为
16、52=25个。(1)不重复抽样的平均误差总是小于重复抽样的平均误差,二者的比值就是修正因子。一、一、重复抽样时样本平均数的分布重复抽样时样本平均数的分布由所有可能样本的平均数取值和相应的概率组成。由所有可能样本的平均数取值和相应的概率组成。例:某施工班组例:某施工班组5个工人的日工资分别为:个工人的日工资分别为:34、38、42、46、50元。则总体工人日工资平均数和方差分别为:元。则总体工人日工资平均数和方差分别为:3438424650425XXN元 222222234 4238 4246 4250 42325X XN元5.2 抽样分布抽样分布统计学统计学(第二版第二版)现用重复抽样方法从现
17、用重复抽样方法从5人中随机抽取人中随机抽取2人组成样本,样本可人组成样本,样本可能数目为能数目为52=25个。各样本的日平均工资计算结果如下:个。各样本的日平均工资计算结果如下:样本变量样本变量343842465034343638404238363840424442384042444646404244465050424446485025个样本的日工资平均数计算表个样本的日工资平均数计算表5.2 抽样分布抽样分布统计学统计学(第二版第二版)根据上表根据上表数据,可数据,可以整理出以整理出样本平均样本平均数的分布数的分布如表:如表:样本日平均工资样本日平均工资频数频数频率频率3411/253622
18、/253833/254044/254255/254444/254633/254822/255011/25合计合计2515.2 抽样分布抽样分布统计学统计学(第二版第二版)5/254/253/252/251/25 34 36 38 40 42 44 46 48 50样本日平均工资分布图样本日平均工资分布图5.2 抽样分布抽样分布统计学统计学(第二版第二版)根据样本日工资平均数分布表,可以计算日工资平均数根据样本日工资平均数分布表,可以计算日工资平均数的数学期望和方差:的数学期望和方差:1()(34*1 36*2 38*3.50*1)4225xfE xxf元222222()()1(3442)*1(
19、3642)*2.(5042)*11625xE xfxf元2()()164xx元5.2 抽样分布抽样分布统计学统计学(第二版第二版)(一)重复抽样的样本平均数的数学期望等于总体平均数。(一)重复抽样的样本平均数的数学期望等于总体平均数。22()()E xE xE xX232()42xnn元(二二)抽样平均数的标准差反映样本平均数与总体平均数之间的平抽样平均数的标准差反映样本平均数与总体平均数之间的平均离差程度,因为:均离差程度,因为:E(x)=X=42元元从以上计算,可以得到两个重要结论:从以上计算,可以得到两个重要结论:所以,抽样平均数的标准差又称为所以,抽样平均数的标准差又称为抽样平均误差抽
20、样平均误差或抽样标或抽样标准误差,以准误差,以 表示。表示。重复抽样的抽样平均误差等于总体标准差重复抽样的抽样平均误差等于总体标准差除以样本单位数的平方根。即:除以样本单位数的平方根。即:5.2 抽样分布抽样分布统计学统计学(第二版第二版)样本平均数的分布与总体分布的比较样本平均数的分布与总体分布的比较总体分布总体分布样本平均数的分布样本平均数的分布42X 322 EEx x 42=162(x)X5042383420100%46484646424240403838363634343/253/252/252/251/251/254/254/255/255/25505044445.2 抽样分布抽样
21、分布统计学统计学(第二版第二版)仍用前面仍用前面5个工人日工资的例子个工人日工资的例子。用不重复抽样方法从中抽取。用不重复抽样方法从中抽取2人组人组成样本,并用样本平均工资来推断总成样本,并用样本平均工资来推断总体平均工资水平。考虑顺序的不重复体平均工资水平。考虑顺序的不重复抽样,样本可能数目为:抽样,样本可能数目为:255*420P 个5.2 抽样分布抽样分布二、不二、不重复抽样时样本平均数的分布重复抽样时样本平均数的分布统计学统计学(第二版第二版)20个样本的日平均工资计算如下表:个样本的日平均工资计算如下表:样本变量样本变量343842465034-363840423836-404244
22、423840-444646404244-485042444648-样本日工资平均数计算表样本日工资平均数计算表5.2 抽样分布抽样分布统计学统计学(第二版第二版)样本日平均工资样本日平均工资频数频数频率频率3621/103821/104042/104242/104442/104621/104821/10合计合计201根据上表根据上表数据,可数据,可以整理出以整理出样本平均样本平均数的分布数的分布如右表:如右表:5.2 抽样分布抽样分布统计学统计学(第二版第二版)E(x)=X=42元(一)大样本并且总体方差已知的情形如果不是正态分布,可由正态分布来近似(n 30)样本统计量是个随机变量,抽样分布
23、就是样本统计量的概率分布。是非标志(0-1变量)的平均数和标准差(p90)2置信度为95%的置信区间为05,Z/2=1.估计总体均值时样本容量的确定无偏性(unbiasedness)总体比例的区间估计(例题分析)一个总体参数的区间估计方法3 一个总体参数的区间估计如果样本均值 x=80,则80就是的估计值(一)正态分布再生定理区间估计(interval estimate)就是在点估计的基础上,以一定的概率给出总体参数估计的一个范围。E(x)=X=42元换言之,大样本比小样本更容易产生一个好的点估计。置信区间(confidence interval)比如,某班级平均分数在7585之间,置信水平是
24、95%统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间1()(36*238*2.48*2)4220 xfE xxf元根据样本日工资平均数分布表,可以计算日工资平均数根据样本日工资平均数分布表,可以计算日工资平均数的数学期望和方差:的数学期望和方差:222222()()1(3642)*2(3842)*2.(4842)*21220 xE xfxf元2()()123.464xx元5.2 抽样分布抽样分布统计学统计学(第二版第二版)从以上计算,也可以得到两个重要结论:从以上计算,也可以得到两个重要结论:(一)不重复抽样的样本平均数的数学期望等于总体平均数。(一)不重复抽样的
展开阅读全文