管理学抽样调查理论与方法第二版分层随机抽样课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《管理学抽样调查理论与方法第二版分层随机抽样课件.pptx》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 管理学 抽样调查 理论 方法 第二 分层 随机 抽样 课件
- 资源描述:
-
1、3.1 定义与符号定义与符号2022-4-161一、定义l在抽样之前,先将总体在抽样之前,先将总体N N个单元划分成个单元划分成L L个互不个互不重复的子总体,每个子总体称为层,它们的大重复的子总体,每个子总体称为层,它们的大小分别为小分别为 ,这个层合起来就是,这个层合起来就是整个总体整个总体 ,然后,在每个层中分别,然后,在每个层中分别进行抽样,这种抽样就是分层抽样,所进行抽样,这种抽样就是分层抽样,所得到的样本称为分层样本。得到的样本称为分层样本。NNNL12,NNhhL1不重不漏总体中的每一个单元一定属于并且只属于某一个层,总体中的每一个单元一定属于并且只属于某一个层,而不可能同时属于
2、两个层或不属于任何一个层。而不可能同时属于两个层或不属于任何一个层。n定义定义3.1 层:层:如果一个包含N个单元的总体可以分成“不重不漏”的L个子总体,即每个单元必属于且仅属于一个子总体,则称这样的子总体为层。即L个子总体所包含的单位数分别为 ,则有n定义定义3.2 分层抽样:分层抽样:又称为类型抽样或分类抽样,即在每一层中独立进行抽样,总的样本由各层样本组成,总体参数则根据各层样本参数的汇总做出估计,这种抽样就称为分层抽样,所得样本称为分层样本。设总得样本量为n,从L个子总体中所抽取的样本量分别为 ,则有,n定义定义3.3 分层随机抽样:分层随机抽样:如果每层中的抽样都是独立地按照简单随机
3、抽样进行的,那么这样的分层抽样称为分层随机抽样分层随机抽样,所得的样本称为分层随机样本。NNNL12,12LNNNN12,Ln nn12Lnnnn分层随机抽样的三个必要条件分层随机抽样的三个必要条件n(1)每层都抽每层都抽;n(2)各层都独立独立地抽;n(3)各层的抽样都是简单随机抽样简单随机抽样。2022-4-164特点:特点:n样本在总体中分布更均匀,更具代表性。样本在总体中分布更均匀,更具代表性。n每层的抽样都是独立进行,允许各层选择不同的抽样每层的抽样都是独立进行,允许各层选择不同的抽样方法。方法。n分层抽样不仅能对总体指标进行估计,而且能对各层分层抽样不仅能对总体指标进行估计,而且能
4、对各层指标进行估计。指标进行估计。n分层抽样的抽样效率较高,也就是说分层抽样的估计分层抽样的抽样效率较高,也就是说分层抽样的估计精度较高。(这是因为分层抽样估计量的方差只和层精度较高。(这是因为分层抽样估计量的方差只和层内方差有关,和层间方差无关。)内方差有关,和层间方差无关。)2022-4-165符号说明符号说明 ( (关于第关于第h h层的记号层的记号 ) )n层号层号 hL12 , ,NhnhiyhiWNNhhfnNhhhYNyhhhiiNh11ynyhhhiinh11SNyYhhhihiNh22111snyyhhhihinh22111单元总数样本单元数第 个单元的值层权抽样比总体均值样
5、本均值总体方差样本方差2022-4-1663.2 3.2 简单估计量及其性质简单估计量及其性质3.2.1 3.2.1 总体均值的简单估计及其性质总体均值的简单估计及其性质n分层样本,总体均值 的估计n分层随机样本,总体均值 的简单估计 YW YNN YsthhhLhhhL111yW yNN ysthhhLhhhL111YYn定理定理 3.3.1 1:对于分层随机抽样, 是 的无偏估计。YstYn定理定理 3.23.2:对于分层随机抽样,有 V YW V YsthhhL21n定理定理 3.33.3:对于分层随机抽样, 的估计量 具有如下性质:YstE yYsty 222112222111 LLh
6、sthhhhhhhLLhhhhhhhhfV yW V YWSnW SW SnN 第第h层样本的样本方差。层样本的样本方差。n定理定理 3.43.4:对于分层随机抽样, 的方差 的无偏估计量:sty2212222111 LhsthhhhLLhhhhhhhhfv yWsnW sW snNstv ysnyyhhhihinh221111hn n推论推论 3.3.1 1:对于分层随机抽样,总体总量 的简单估计量 有如下性质: (1) (2) (3) 是 的一个无偏估计。stYNyY()stE YY21()LhsthhhhhSV YNNnn21()Lhsthhhhhsv YNNnn()stV Yn推论推论
7、 3.23.2:对于分层随机抽样,总体比例 的简单估计量 有如下性质: (1) (2) (3) 是 的一个无偏估计。1LsthhhpW pP()stE pP2211()1LhhhhsthhhhNn PQV pNNNn()stV P211()1LhhsthhhhhNnv pNp qNnn推论推论 3.33.3:对于分层随机抽样,总体中具有指定特征的单元总数 的简单估计量 为: 具有如下性质: (1) (2) (3) 是 的一个无偏估计。AstA()stV A11LLststhhhhhhANpNW pN p()stE AA21()1LhhhhsthhhhNn PQV ANNn1()1Lhhhsth
8、hhhNNnv Ap qn2022-4-1613例例3.13.1 n调查某地区的居民奶制品年消费支出,以居民户为抽调查某地区的居民奶制品年消费支出,以居民户为抽样单元,根据经济及收入水平将居民户划分为样单元,根据经济及收入水平将居民户划分为4层,每层,每层按简单随机抽样抽取层按简单随机抽样抽取10户,调查获得如下数据(单户,调查获得如下数据(单位:元),要估计该地区居民奶制品年消费总支出及位:元),要估计该地区居民奶制品年消费总支出及其置信区间。其置信区间。层层居民户居民户总数总数样本户奶制品年消费支出样本户奶制品年消费支出12345678910120010400110151040809002
9、400501306080100551608516017037501802601100140602001803002204150050351502030251030252850N 101,2,3,4hnh112000.070182850NWN111100.05200nfN224000.140352850NWN222100.025400nfN337500.263162850NWN333100.0133750nfN4415000.526322850NWN444100.00671500nfN11111139.5niiyyn1221111111624.7221niisyyn2105y 3165y 424
10、y 222166.667s 238205.556s 24193.333s 2022-4-161541sthhhYN y200 39.5400 105750 16515002420965044222281115.93 10hsthhhhhhhfv YNW v yNsn/2209650 1.96 23207.6stZv YstY2022-4-1616例例3.23.2 n在例在例3.1的调查中,同时调查了居民户拥有家的调查中,同时调查了居民户拥有家庭电脑的情况,获得如下数据(单位:台),庭电脑的情况,获得如下数据(单位:台),要估计该地区居民拥有家庭电脑的比例及置信要估计该地区居民拥有家庭电脑的比例
11、及置信水平为水平为95%的置信区间。的置信区间。层层居民居民户总户总数数样本户拥有家庭电脑情况样本户拥有家庭电脑情况123456789101200000100010024000100000010375011000010104150010000000002022-4-1617解:由上表可得,由上表可得, 根据前面对各层层权根据前面对各层层权 及抽样比及抽样比 的计算结果,可得各层估计量的方差:的计算结果,可得各层估计量的方差: 因此,该地区居民拥有家庭电脑比例的估计为:因此,该地区居民拥有家庭电脑比例的估计为: 估计量的方差为:估计量的方差为: 估计量的置信区间为:估计量的置信区间为:2 . 0
12、1p2 . 02p4 . 03p1 . 04phWhf1 111110.01691p qv pfn2222210.01731p qv pfn3333310.02631p qv pfn4444410.00991p qv pfn41411hhhhhhstpNNpWp12000.24000.27500.415000.128500.241221hhhstpvNNpv2222212000.01694000.01737500.026315000.009928500.005/2ststpZv pn两种途径:n分别比估计:分别比估计:对每层样本分别考虑比估计量,然后对各层的比估计量进行加权平均,即先“比”后“
13、加权”;n联合比估计:联合比估计:对比率的分子和分母分别加权计算出总体均值或总体总量的分层估计量,然后用对应的分层估计量来构造比估计,即先“加权”后“比”。3.3 比率估计量及其性质比率估计量及其性质3.3.1 3.3.1 分别比估计分别比估计定义定义 3.4 总体均值 和总体总量 的分别比估计为:YYhhhhRhhRSXxyWyWyRhhhhRSRSYXxyyNY定理定理 3.5 对于分层随机抽样的分别比估计,若各层的样本量 都比较大,则有()RSE yY22221()()(1) (2)RSRSLhhyhhxhhyxhhhMSE yV yWfSR SR Snhn根据定理定理3.5, 很容易推
14、得在各层样本量 都比较大的情况下,有()RSE YY22221()()(1) (2)RSRSLhhyhhxhhyxhhhMSE YV YNfSR SR Snhn3.3.2 3.3.2 联合比估计联合比估计定义定义 3.5 总体均值 和总体总量 的联合比估计为:YYXRXxyyCststRCXRyNXxyYCRCststRC1LsthhhyW y1LsthhhxW x定理定理 3.6 对于分层随机抽样的分别比估计,若各层的样本量 都比较大,则有()RCE yY22221()()(1) (2)RCRCLhhyhxhyxhhhMSE yV yWfSR SRSnhn根据定理定理3.6, 很容易推得在各
15、层样本量 都比较大的情况下,有()RCE YY22221()()(1) (2)RCRCLhhyhxhyxhhhMSE YV YNfSR SRSnhn3.3.3 分别比估计与联合比估计的比较分别比估计与联合比估计的比较 22221221()()(1) 2(1) 2RCRSLhhhxhhyxhhhLhhhhxhyxhhhV yV yWfRRSRRSnWfRRRRSSnn两种途径:n分别回归估计:分别回归估计:对每层样本分别求取回归估计量,然后对各层的回归估计量进行加权平均,即先“回归”后“加权”;n联合回归估计:联合回归估计:对两个变量先分别计算出总体总值或总体均值的分层简单估计量,然后再对它们的
16、分层估计量来构造回归估计,即先“加权”后“回归”。3.4 回归估计量及其性质回归估计量及其性质3.4.1 3.4.1 分别回归估计分别回归估计定义定义 3.6 分别回归估计是指在分层随机抽样中,先在每层中对层均值或层总和做回归估计,然后再对各层的回归估计按总体层权进行加权平均。对 的分别回归估计为:对 的分别回归估计为:YY11()LLlrshlrhhhhhhhhyW yWyXx11() =()LlrslrshhhhhhLhhhhhhYNyNWyXxNyXx1. 各层的回归系数 事先给定h()lrsE yY()lrsE YY22221(1)()(2)LhhlrsyhhxhhxyhhhWfV y
17、SSSn 22221(1)()(2)LhhlrsyhhxhhxyhhhNfV YSSSn 2(1,2. )xyhhxhShLS 222min(1)()(1)hhlrsyhhhWfVySn2. 不能事先设定各层的回归系数 h2221(1)()(1)LhhlrsyhhhhWfV ySn若 不能事先设定,则将 取为第h层总体回归系数 的最小二乘估计 , 即为样本回归系数:hhhbhb121()()()hhnhihhihihnhihiyyxxbxx2221(1)()1(1)(2)LhhlrshyhhhhhWfv ynsrn n2:hr第h层样本相关系数的平方3.4.2 3.4.2 联合回归估计联合回归
18、估计定义定义 3.7 联合回归估计是指在分层随机抽样中,先对 和 作分层估计:YX1LsthhhyW y1LsthhhxW x进而构造总体均值 的联合回归估计为:总体总量 的联合回归估计为:YY()lrclrcststYNyYXX()lrcststyyXx1. 当 为事先设定的常数()lrcE yY()lrcE YY22221(1)()(2)LhhlrcyhxhxyhhhWfV ySSSn 22221(1)()(2)LhhlrcyhxhxyhhhNfV YSSSn 21221(1)/(1)/LhhxyhhhcLhhxhhhWfSnBWfSn 2222min(1)()()hhlrcyhcxhhW
19、fVySB Sn2. 当回归系数 不能事先设定22221(1)()(2)LhhlrcyhcxhcxyhhhWfV ySB SBSn当 不能事先设定,取 的样本估计 :cBcb222 21(1)()(2)Lhhlrcyhcxhc xyhhhWfv ysb sb sn2:hr第h层样本相关系数的平方21221(1)/(1)/LhhxyhhhcLhhxhhhWfsnbWfsn3.4.3 分别回归估计与联合回归估计的比较分别回归估计与联合回归估计的比较2222222minmin11222221(1)(1)()()()(1)(1) () LLhhhhlrclrsyhcxhyhhhhhhLxyhhhcxh
20、hhxhWfWfVyVySB SSnnSWfB SnS21 0LhhchaBB当 和 均取最优值时,分别回归估计优于联合回归估计,尤其是当回归系数相差较大时,分别回归估计的优越性更加明显。h小结小结 在比估计中,分别比估计与联合比估计均为有偏估计量,当各层样本量都比较大时,分别比估计与联合比估计近似无偏;当某些层的样本量不够大,而总样本量较大时,联合比估计近似无偏。 在回归估计中,少数情况下,回归系数是可以事先设定的常数,其估计量无偏;多数情况下,回归系数需利用样本回归系数进行估计,其估计有偏,但在大样本的情况下近似无偏。2022-4-16353.5 3.5 各层样本量的分配各层样本量的分配
21、n 当总样本量当总样本量n固定,如何将这固定,如何将这n个样本合个样本合理地分配到各层去?理地分配到各层去?222211LLhhhhsthhhW SW SV ynN估计量的方差不仅与各层的方差有关,还和各层所估计量的方差不仅与各层的方差有关,还和各层所分配的样本量有关。分配的样本量有关。实际工作中有不同的分配方法,实际工作中有不同的分配方法,(1 1)常数分配;)常数分配;(2 2)与层内方差)与层内方差 成比例地分配;成比例地分配;(3 3)与层权)与层权 成比例的分配成比例的分配( (比例分配比例分配) );(4 4)与)与 成比例地分配(内曼最优分配)。成比例地分配(内曼最优分配)。2h
展开阅读全文