统计抽样精品课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《统计抽样精品课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 抽样 精品 课件
- 资源描述:
-
1、第七章第七章 统计抽样统计抽样1/52统计抽样主要研究什么内容,解决什么问题统计抽样主要研究什么内容,解决什么问题?抽样方法主要有哪几种方法?抽样方法主要有哪几种方法?如何确定样本容量?如何确定样本容量?第七章统计抽样第七章统计抽样2/567.1 7.1 统计抽样基本概念统计抽样基本概念 总体由研究对象的全体所组成。总体由研究对象的全体所组成。样本是总体中的部分元素所组成的集合。样本是总体中的部分元素所组成的集合。目标总体是我们要推断的总体目标总体是我们要推断的总体 抽样总体是实际抽取样本的总体抽样总体是实际抽取样本的总体 第七章统计抽样第七章统计抽样3/56在抽样之前,应将总体划分为抽样单位
2、。抽样单在抽样之前,应将总体划分为抽样单位。抽样单位既可以是一个简单的个体,也可以是一组个体。位既可以是一个简单的个体,也可以是一组个体。对某一个特殊研究,抽样单位的名册称为抽样框。对某一个特殊研究,抽样单位的名册称为抽样框。7.1 7.1 统计抽样基本概念统计抽样基本概念第七章统计抽样第七章统计抽样4/56调调查查方方法法邮寄调查邮寄调查电话调查电话调查个人采访调查个人采访调查7.2 7.2 抽样调查种类和抽样方法抽样调查种类和抽样方法第七章统计抽样第七章统计抽样5/56调调查查误误差差非抽样误差非抽样误差 抽样误差抽样误差 由于没有对总体的由于没有对总体的所有单位进行调查所有单位进行调查而
3、产生的误差而产生的误差 进行一次抽样调查进行一次抽样调查可能出现的如测量可能出现的如测量误差、采访者误差误差、采访者误差及数据处理误差等。及数据处理误差等。7.3 7.3 调查误差调查误差第七章统计抽样第七章统计抽样6/56从一个容量为从一个容量为N N的有限总体中抽取得到一个容量为的有限总体中抽取得到一个容量为n n的简单随机样本,使每一个容量为的简单随机样本,使每一个容量为n n的可能样本,都的可能样本,都有相同的概率被抽中。有相同的概率被抽中。建立抽样框建立抽样框根据随机数表进行抽样根据随机数表进行抽样抽样总体中所抽样总体中所有个体的名册有个体的名册使用随机数表,可使用随机数表,可以保证
4、抽样总体中以保证抽样总体中的每个个体都有相的每个个体都有相同的概率被抽中同的概率被抽中 7.4 7.4 简单随机抽样简单随机抽样第七章统计抽样第七章统计抽样7/56总体均值总体均值总体比率总体比率样本容量的确定样本容量的确定7.4 7.4 简单随机抽样简单随机抽样第七章统计抽样第七章统计抽样8/56如果选择大样本(如果选择大样本(n30n30),则中心极限定理),则中心极限定理可以保证可以保证 的抽样分布近似服从正态概率分布,的抽样分布近似服从正态概率分布,的区间估计为的区间估计为 式中,式中,为均值的标准差。为均值的标准差。1 1称为置信度,称为置信度,为与之对应的临界值。为与之对应的临界值
5、。例如,若置信度为例如,若置信度为9595,则,则 。xxxx2/x2/96.1025.07.4.1 7.4.1 总体均值总体均值第七章统计抽样第七章统计抽样9/56当从一个容量为当从一个容量为N N的有限总体中,抽取一个容量的有限总体中,抽取一个容量为为n n的简单随机样本时,均值的标准差的估计值为的简单随机样本时,均值的标准差的估计值为此时总体均值的区间估计为此时总体均值的区间估计为 在抽样调查中,当构造置信区间时,通常取在抽样调查中,当构造置信区间时,通常取=2 2。因此,在使用简单随机样本时,总体均值的近似。因此,在使用简单随机样本时,总体均值的近似9595的置信区间的表达式为:的置信
6、区间的表达式为:nsNnNsx1xsx2/xsx27.4.1 7.4.1 总体均值总体均值第七章统计抽样第七章统计抽样10/56例例7.17.1摄影摄影是一本推介摄影作品、报道摄影是一本推介摄影作品、报道摄影发展状况、介绍摄影器材的杂志,它目前拥有发展状况、介绍摄影器材的杂志,它目前拥有80008000个个订户。根据一个订户。根据一个484484个订户的简单随机样本,得出订户个订户的简单随机样本,得出订户的年平均收入为的年平均收入为3050030500元,标准差为元,标准差为70407040元。因此,所元。因此,所有订户的年平均收入的无偏估计为有订户的年平均收入的无偏估计为 元。元。因此,这本
7、杂志订户的年平均收入的近似因此,这本杂志订户的年平均收入的近似9595的置信的置信区间为区间为即(即(2988029880,3112031120)。)。310484040 71000 8484000 8xs620500 303102500 3030500 x7.4.1 7.4.1 总体均值总体均值第七章统计抽样第七章统计抽样11/56上述过程也可用于对诸如总体总量或总体比率上述过程也可用于对诸如总体总量或总体比率等其他总体参数的区间估计。对点估计的抽样分布等其他总体参数的区间估计。对点估计的抽样分布近似服从正态概率分布的所有情形,其近似近似服从正态概率分布的所有情形,其近似9595的的置信区间
8、为置信区间为例如,在例如,在摄影摄影的抽样调查中,点估计量的标准的抽样调查中,点估计量的标准误差的估计值为,允许误差为误差的估计值为,允许误差为2 2310310元元620620元。元。2点估计值点估计量标准误差估计值元310 xs7.4.1 7.4.1 总体均值总体均值第七章统计抽样第七章统计抽样12/56总体比率总体比率p p是总体中具有某些感兴趣特征的个体的比是总体中具有某些感兴趣特征的个体的比重。重。例例7.27.2在市场调查研究中,人们想了解喜欢某一品在市场调查研究中,人们想了解喜欢某一品牌的消费者比重。样本比率牌的消费者比重。样本比率 是总体比率的无偏点是总体比率的无偏点估计。总体
9、比率的标准差的估计值为估计。总体比率的标准差的估计值为因此,因此,总体比率的近似总体比率的近似9595的置信区间的表达式如下:的置信区间的表达式如下:pnppNnNsp)1(1psp27.4.2 7.4.2 总体比率总体比率第七章统计抽样第七章统计抽样13/56例如,在大宇国际咨询公司的抽样调查中,大宇国例如,在大宇国际咨询公司的抽样调查中,大宇国际咨询公司也想估计在它服务范围内的际咨询公司也想估计在它服务范围内的500500所学校中,所学校中,使用天然气作为取暖燃料的学校比率。如果在抽出使用天然气作为取暖燃料的学校比率。如果在抽出的的5050所学校中,有所学校中,有3535所学校使用天然气作
10、为取暖燃所学校使用天然气作为取暖燃料,则总体料,则总体500500所学校中使用天然气比率的点估计所学校中使用天然气比率的点估计值值 。比率的标准差的估计值为。比率的标准差的估计值为因此,因此,总体比率的近似总体比率的近似9595置信区间为置信区间为即(即(0.5758,0.8242 0.5758,0.8242)。)。70.050/35p0621.0507.017.0150050500)(ps1242.07.00621.027.07.4.2 7.4.2 总体比率总体比率第七章统计抽样第七章统计抽样14/56nsNnNsx12/nsNnNB12 回忆前面提到的允许误差为回忆前面提到的允许误差为“点
11、估计的标准差估计值点估计的标准差估计值的的2 2倍倍”,因此,因此:222(1)4NsnBNs 均值的标准差的估计值:均值的标准差的估计值:7.4.3 7.4.3 样本容量的确定样本容量的确定第七章统计抽样第七章统计抽样15/56两步抽样两步抽样用试点调查或事先用试点调查或事先检验的结果估计检验的结果估计s s2 2 估估计计s s2 2的的方方法法根据以往的资料估计根据以往的资料估计s s2 2 由第一步抽取的部分由第一步抽取的部分单位,得到的单位,得到的s s2 2的估的估计值,将此值代入上计值,将此值代入上式,确定出全部样本式,确定出全部样本容量容量n n;然后对第一;然后对第一步确定的
12、全部样本容步确定的全部样本容量,再抽取第二步所量,再抽取第二步所需要的其余单位数。需要的其余单位数。7.4.3 7.4.3 样本容量的确定样本容量的确定第七章统计抽样第七章统计抽样16/56 例例7.37.3某大学有某大学有50005000名毕业生,我们想构造宽度在名毕业生,我们想构造宽度在10001000元之内的近似元之内的近似9595的置信区间。的置信区间。对这样规定的置信区间,对这样规定的置信区间,B B500500。在确定。在确定n n之前,之前,需要估计需要估计 。假设根据去年所做的同样研究,得知假设根据去年所做的同样研究,得知s s30003000元。元。我们可以用这个值来估计我们
13、可以用这个值来估计 。根据。根据B=500B=500、s s3000 3000 及及N N50005000,则样本容量为,则样本容量为2s2s97.13930004500500030005000222n7.4.3 7.4.3 样本容量的确定样本容量的确定第七章统计抽样第七章统计抽样17/56在估计总体比率时,选择样本容量的公式,与估计在估计总体比率时,选择样本容量的公式,与估计总体均值的公式类似。我们只需要将估计总体均值的公总体均值的公式类似。我们只需要将估计总体均值的公式中式中 替换为替换为 ,即,即 使用上式时,我们必须规定允许误差使用上式时,我们必须规定允许误差B B和给出和给出 的一个
14、估计值。如果没有合适的估计值,我们可以使的一个估计值。如果没有合适的估计值,我们可以使用用 代替,这样将保证近似置信区间的允许误差代替,这样将保证近似置信区间的允许误差比希望的要小的多。比希望的要小的多。2s)1(pp2(1)(1)(1)4NppnBNppp5.0p7.4.3 7.4.3 样本容量的确定样本容量的确定第七章统计抽样第七章统计抽样18/56将总体划分将总体划分H H组组从第从第h h层中抽取一个容量层中抽取一个容量为为n nh h的简单随机样本的简单随机样本 由这由这H H个简单随个简单随机样本的联合资机样本的联合资料,可得出诸如料,可得出诸如总体均值、总体总体均值、总体总量及总
15、体比率总量及总体比率等各种总体参数等各种总体参数的估计。的估计。分层简单随机抽样的步骤:分层简单随机抽样的步骤:也称为层也称为层7.5 7.5 分层简单随机抽样分层简单随机抽样第七章统计抽样第七章统计抽样19/56如果各层内的差异比层间的差异小,则分层简单如果各层内的差异比层间的差异小,则分层简单随机样本可得到更大的精度(总体参数的区间估计将随机样本可得到更大的精度(总体参数的区间估计将更窄)。更窄)。各层的划分应依据样本设计者的判断。各层的划分应依据样本设计者的判断。总体可按部门、地区、年龄、产品类型、销售水总体可按部门、地区、年龄、产品类型、销售水平等分层。平等分层。7.5 7.5 分层简
16、单随机抽样分层简单随机抽样第七章统计抽样第七章统计抽样20/56 例例7.47.4某大学管理学院想对今年的毕业生进行一次某大学管理学院想对今年的毕业生进行一次调查,以便了解他们开始工作时的年薪。调查,以便了解他们开始工作时的年薪。7.5 7.5 分层简单随机抽样分层简单随机抽样第七章统计抽样第七章统计抽样21/56在分层抽样中,总体均值的无偏估计是各层样在分层抽样中,总体均值的无偏估计是各层样本均值的加权平均数,所用权数为总体在各层的比本均值的加权平均数,所用权数为总体在各层的比重。用重。用 表示总体均值的点估计,其定义如下:表示总体均值的点估计,其定义如下:式中:式中:H-H-层数;层数;-
17、第第h h层的样本均值;层的样本均值;N Nh h-第第h h层的单位数;层的单位数;N-N-总体单位数;总体单位数;对分层简单随机样本,计算平均值的标准差的对分层简单随机样本,计算平均值的标准差的估计公式为估计公式为stxHhhhstxNNx1hxHNNNN21HhhhhhhxnsnNNNsst122)(17.5.1 7.5.1 总体均值总体均值第七章统计抽样第七章统计抽样22/56某大学管理学院的某大学管理学院的180180名毕业生的样本调查结果名毕业生的样本调查结果 7.5.1 7.5.1 总体均值总体均值第七章统计抽样第七章统计抽样23/56各专业(层)的样本均值分别为:各专业(层)的
18、样本均值分别为:因此,总体均值的点估计为因此,总体均值的点估计为29350310001500150270001500300310001500200285001500350300001500500stx7.5.1 7.5.1 总体均值总体均值第七章统计抽样第七章统计抽样24/56抽样调查中估计均值的标准差所需要的部分计算结果抽样调查中估计均值的标准差所需要的部分计算结果 7.5.1 7.5.1 总体均值总体均值第七章统计抽样第七章统计抽样25/56上表中上表中因此,因此,总体的近似总体的近似9595的置信区间为的置信区间为即(即(2907429074,2962629626)。)。84290903
19、769)(512hhhhhhnsnNN13868.1907084290903769150012stxs276293501382293507.5.1 7.5.1 总体均值总体均值第七章统计抽样第七章统计抽样26/56对分层简单随机抽样,总体比率对分层简单随机抽样,总体比率p p的无偏估计是的无偏估计是各层比率的加权平均数,所用权数为总体在各层的各层比率的加权平均数,所用权数为总体在各层的比重。总体比率的点估计定义如下:比重。总体比率的点估计定义如下:式中:式中:H-H-层数;层数;-第第h h层的样本比率;层的样本比率;N Nh h第第h h层的单位数;层的单位数;NN总体单位数;总体单位数;H
20、hhhstpNNp1hpHNNNN217.5.2 7.5.2 总体比率总体比率第七章统计抽样第七章统计抽样27/56的标准差的估计值为的标准差的估计值为总体比率的近似总体比率的近似9595的置信区间的表达式为的置信区间的表达式为stpHhhhhhhhpnppnNNNsst121)1()(1stpstsp27.5.2 7.5.2 总体比率总体比率第七章统计抽样第七章统计抽样28/56 例例7.5 7.5 在某大学的调查中,大学想了解毕业生开在某大学的调查中,大学想了解毕业生开始工作时的年薪不低于始工作时的年薪不低于36 00036 000元的比率。元的比率。180180名毕业名毕业生的抽样调查结
21、果显示,有生的抽样调查结果显示,有2020名毕业生开始工作时名毕业生开始工作时的年薪不低于的年薪不低于3600036000元,其中会计专业元,其中会计专业4 4名,金融专名,金融专业业2 2名,信息系统专业名,信息系统专业7 7名,市场营销专业名,市场营销专业1 1名,经营名,经营管理专业管理专业6 6名。名。7.5.2 7.5.2 总体比率总体比率第七章统计抽样第七章统计抽样29/56根据总体比率的近似根据总体比率的近似9595的置信区间的公式,的置信区间的公式,开始工作时的年薪不低于开始工作时的年薪不低于3600036000元的比率的点估计为:元的比率的点估计为:故毕业生开始时的年薪不低于
展开阅读全文