书签 分享 收藏 举报 版权申诉 / 58
上传文档赚钱

类型第2章-简单随机抽样课件.ppt

  • 上传人(卖家):晟晟文业
  • 文档编号:4608000
  • 上传时间:2022-12-24
  • 格式:PPT
  • 页数:58
  • 大小:456.06KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《第2章-简单随机抽样课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    简单 随机 抽样 课件
    资源描述:

    1、第第2章章 简单随机抽样(简单随机抽样(SRS)2.1 定义及其抽选方法2.2 简单估计量及其性质简单估计量及其性质2.3 样本量的确定样本量的确定2.4 设计效应设计效应2.5 逆抽样 2.1定义与符号定义与符号n简单随机抽样也称为纯随机抽样。n从含有 N 个单元的总体中抽取 n 个单元组成样本,如果抽样是不放回的,则所有可能的样本有 个,若每个样本被抽中的概率相同,都为 ,这种抽样方法就是简单随机抽样。n具体抽样时,通常是逐个抽取样本单元,直到抽满n个单元为止。CNnnNC1有限放回简单随机抽样不放回简单随机抽样n放回简单随机抽样(SRS with replacement)n当从总体N个抽

    2、样单元中抽取n个抽样单元时,如果依次抽取单元时,不管以前是否被抽中过,每次都从N个抽样单元中随机抽取,这时,所有可能的样本为?个(考虑样本单元的顺序),n每个样本被抽中的概率为?n放回简单随机抽样在每次抽取样本单元时,都将前一次抽取的样本单元放回总体,因此,总体的结构不变,抽样是进行的,这一点是它与不放回简单随机抽样的主要不同之处。n放回简单随机抽样的样本量不受总体大小的限制,可以是任意的。n简单随机抽样的抽取原则:n(1)按随机原则取样;n(2)每个抽样单元被抽中的概率都是已知的或事先确定的;n(3)每个抽样单元被抽中的概率都是相等的。所有可能样本每个样本被抽中的概率相同所有可能样本每个样本

    3、被抽中的概率相同【例例2.1】n设总体有5个单元(1、2、3、4、5),按放回简单随机抽样的方式抽取2个单元,则所有可能的样本为25个(考虑样本单元的顺序):1,12,13,14,15,11,22,23,24,25,21,32,33,34,35,31,42,43,44,45,41,52,53,54,55,5(2)不放回简单随机抽样(SRS without replacement)n当从总体N个抽样单元中依次抽取n个抽样单元时,每个被抽中的单元不再放回总体,而是从总体剩下的单元中进行抽样。n不放回简单随机抽样的样本量要受总体大小的限制。n在实际工作中,更多的采用不放回简单随机抽样。【例例2.2】

    4、n设总体有5个单元(1、2、3、4、5),按不放回简单随机抽样的方式抽取2个单元,则所有可能的样本为个:1,22,33,44,51,32,43,5 1,42,5 1,5 符号 n大写符号表示总体的标志值,n用小写符号表示样本的标志值 NNiiYYYYY211nniiyyyy211NYYYYNYNNii2111nyyyynynnii2111NiiYNNAP1110或iYniiynnap1110或iyXYXYXYRNiiNii11xyxyRniinii112122111NNYYNSNiiniiyyns12211总 体样 本 n总体指标值上面带符号“”的表示由样本得到的总体指标的估计。n 称 为抽样

    5、比,记为f。n估计量的方差用大写的V表示,对 的样本估计,不用 而用 表示。Nn Yv YV YV二、抽选方法二、抽选方法n1抽签法n 2随机数法随机数表、随机数骰子、摇奖机、计算机产生的伪随机数 随机数表法:N=327 n5讨论:(1)总体编号为135,在0099中产生随机数,若=00或35,则抛弃重抽。(2)总体编号为135,在0099中产生随机数,以除以35,余数作为被抽中的数,如果余数为0,则被抽中的数为35。三、地位与作用三、地位与作用n优点n简单直观n理论基础n缺点nN很大时难以获得抽样框n样本分散不易实施,调查费用高n很少单独使用,一般结合其他方法使用n没有其他信息时使用n多变量

    6、复杂数据分析2.2 简单估计量及其性质简单估计量及其性质n 判断下面要估计的总体目标量分别属于什么类型?n调查城市居民家庭平均用电量。n估计湖中鱼的数量。n测试日光灯的寿命。n估计居民家庭用于做饭菜及饮用的用水量占家庭总用水量的比重。n估计婴儿出生性别比。n检测食盐中碘含量。一、对总体均值的估计一、对总体均值的估计 以样本均值作为总体均值的估计n性质性质1 1:对于简单随机抽样,是 的无偏估计。ynyiin11yY YyE例设总体为0,1,3,5,6,计算总体均值 =3、总体方差 =5.2和 =6.5;给出全部 的样本,并验证 及 。Y22S2n E yY22E sSyY 1010.5-2.5

    7、0.52031.5-1.54.53052.5-0.512.540630185132-126153087163.50.512.58354129364.51.54.510平均565.52.50.5 306.5 方差1.95 样本编号单元1单元2样本均值-样本方差 证明 性质性质1 1 n对于固定的有限总体,估计量的期望是对所有可能样本求平均得到的,因此n总体中每个特定的单元 在不同的样本中出现的次数。nNnnNnCyyyCyyE21iy11nNCNiinNnYCnyyyny111211111)!()!1()!1()!(!nNnNCnNnNnNnNnNnNC YYNnCYCCyyENiinNNiin

    8、NnN11111证明 性质性质1 1(对称性论证法)(对称性论证法)n由于每个单元出现在总体所有可能样本中的次数相同,因此 一定是 的倍数,且这个倍数就是 ,nyyyE21NYYY21Nn YYNnnyEnyENiinii1111性质性质2:n对于有限总体的方差定义:n性质性质2:对于简单随机抽样,的方差式中:为抽样比,为有限总体校正系数。2211NYYiiNSNYYiiN22111y 221SnfSNnnNyVfn N1 f证明性质性质2(对称论证法):n 中的求和是对 项的,n 中的求和是对 项的 2121YynEYyEyVnii)()(1)(1)(12212212YyYyEnYyEnYy

    9、Enjjiiniinii2121)()(YYNnYyENiinii)()()1()1()()(YYYYNNnnYyYyEjjiijjii)()(YyYyEjjii)()(YYYYjjii2)1(nn2)1(NN)()(1)(12212YyYyEnYyEnyVjjiiniijijiNiiYYYYNNnnnYYNnn)()1()1(1)(12212jijiNiiYYYYNnYYnN)(11)(1212121)(11)(11YYNnYYNnNiiNii2121)(11)(1111YYNnYYNnnNNiiNii2121)(111)(11YYNNnNnYYNnNnNNiiNii221SnfSnNnN每

    10、个特定单位被选入样本的概率:=P(i)=故其定义为:*不放回抽样*每个样本被抽中的概率为*每个单位被选入样本的概率 NnNnNn)()(1111)(1Nn)1()1()()(2222NNnnNnNni),(jiPij利用无限总体理论 Mean =iNYNY1i01sisi随机变量NnEEii)()(2NnPi)1(NiiniYnyny11证明性质性质2)1(11)1()()()(),cov(2NnNnNNnNnNnEEEjijiji)11()1&1()(NnNnpEjiji)1()()1(1)1(1)()1()1(1)1(111)1(111)1()1(1),(cov)(112121211221

    11、211221122112212NnnSYYNNNNnnYYYNNNNnnYYNYNnNnnNNnNnYYYNnNnnVYYVYnYVnyVNiNiiNiNiiNiiNiNijNijiNiNijNijiNiNijijNijiiNiiiiiiii)1()()()(222NnNnNnNnEEViii简单随机抽样下,简单估计量估计精度影响因素:n估计量的方差 是衡量估计量精度的度量。影响估计量方差的因素主要是样本量 。n通常N很大,当f0.05时,可将 近似取为1。总体方差是我们无法改变的;因此,在简单随机抽样的条件下,只有通过加大样本量来提高估计量的精度。V yS21 f 性质性质3 3:的样本无偏

    12、估计为:n证明:V y v yfns12niiyyns122)(11212)()(11YynYynnii21212)1()()(SNNnYYNnYyENiinii2221SnNnNSnfYyE2122)()(11)(YynEYyEnsEnii22)1(11SnNnNnSNNnn)()1()1(2nNNnnNS2Sn大样本下,抽样调查估计量渐进正态)1,0()(NS1)(|(SP)(S【例例2.32.3】n我们从某个=100的总体中抽出一个大小为=10的简单随机样本,要估计总体平均水平并给出置信度为95%的区间估计。iiy序号12345678910452046615085105011niiyny

    13、1111.199172)(11122niiyynsn由置信度95%对应的 ,因此,可以以95%的把握说总体平均水平大约在 之间,即2.4295和7.5705之间。5 yY 72.11111.19101.0112snfYv 3115.1YvYs96.1t3115.196.15有放回简单随机抽样 YyE 2211nSNnNyV 21snyv二、对总体总量的估计 YNYYiiN1niiynNyNY1 YYE V YN V yNfnS()2221 v YN v yNfns()2221【例例2.42.4】续例2.3。估计总体总量,并给出在置信度95%的条件下,估计的极限相对误差。n在置信度95%下,的极

    14、限相对误差为:5005100Y 172001111.19101.011002Yv 1488.131YvYs%41.515141.05001488.13196.1YYstY三、对总体比例的估计 n某一类特征的单元占总体单元数中的比例P.n将总体单元按是否具有这种特征划分为两类,设总体中有个单元具有A这个特征,如果对每个单元都定义指标值n Yii10,第 个单元具有所考虑的特征;,否则PANNYYiiN11n总体方差:SNYYiiN22111PQNNPANPAN1)()1(1122估计量 n n性质性质5 5:对于简单随机抽样,是 P 的无偏估计。的方差为:panpp V pPQnNnN1 v p

    15、fnpq11证明PQNNPANPANS1)()1(11222pqnns1221)(snfpv v pfnpq11【例例2.52.5】n某超市新开张一段时间之后,为改进销售服务环境,欲调查附近几个小区居民到该超市购物的满意度,该超市与附近几个小区的居委会取得联系,在总体中按简单随机抽样抽取了一个大小为=200人的样本,调查发现对该超市购物环境表示满意或基本满意的居民有130位,要估计对该超市购物环境持肯定态度居民的比例,并在置信度95%下,给出估计的近似置信区间、极限绝对误差。假定这时的抽样比可以忽略。n95%近似置信区间为 58.37%,71.63%65200130nap 001143.035

    16、.051200111pqnfpv 0338.0pvps0338.096.165.02.3 样本量的确定n费用n 总费用 固定费用 可变费用n nccC10设计费分析费办公费管理费场租费等访问员费交通费礼品费电话费等STEPSn所需要的精度n找出样本量与精度之间的关系n估计所需的数值,求解 nn如超出预算,调整精度值重新计算精度margin of errorn对精度的要求通常以允许最大绝对误差(绝对误差限)或允许最大相对误差(相对误差限)来表示。drPd 1Pr 1样本量足够大时,可用正态分布近似 tCvStVtr tSVtd变异系数 Sample Size n0为重复抽样条件下的样本量Nnnn

    17、0012202t Sn 当N很大时,0,n n0,wr与wor几乎没有区别。Nn0220)()(rtcYrtsn总体参数为总体参数为P P的情形的情形 V pPQnNnN1nPQNnNtpVtd1)(nPQNnNPtPpVtr1)(1112222dPQtNdPQtn111)(2222PrQtNPrQtnn f0.05 220dPQtn PrQtn220nnnN0011总体方差的估计n根据预调查数据或以前文献资料n根据数据的分布粗略估算S,例如全距/4,全距/6n对于比例估计,如果P在0.5附近(),可根据PQ在P=0.5时达到极大值来对样本量进行计算.n如果时间允许,且总体在时间上变化不快,调

    18、查可以分为两步,首先确定一个可以承受的样本量,调查后对估计精度进行计算,如果精度达到要求,则不再进行下一步,否则,计算为达到精度要求所需的样本量,再调查补充样本n通过定性分析,最好是对总体变异系数进行分析并估计,因为变异系数通常变化不大.10nnn样本量设计中的误区样本量设计中的误区 1.估计精度越高越好吗?估计精度越高越好吗?简单随机抽样估计比例简单随机抽样估计比例P的样本量与误差(的样本量与误差(当当P=0.5时)时)样本量样本量 误差误差d 50 0.14 100 0.10 500 0.045 1000 0.032 10000 0.0098 对精度要求的判断十分重要。为得到最小误差而选择

    19、最对精度要求的判断十分重要。为得到最小误差而选择最大样本量不是好的选择。大样本量不是好的选择。2202t Sn 2.样本量与总体规模样本量与总体规模N有关吗?按照总体比例确定样本量合有关吗?按照总体比例确定样本量合适吗?适吗?例:简单随机抽样估计例:简单随机抽样估计P,置信度置信度95%,允许误差,允许误差5%,在在P=0.5条件条件下下 总体规模(总体规模(N)所需样本量(所需样本量(n)50 44 100 80 500 222 1000 286 5000 370 10000 385 100000 398 1000000 400 10000000 400 由此可知,在精度要求相同条件下,在北

    20、由此可知,在精度要求相同条件下,在北京市进行一项调查和在全国进行一项调查,样京市进行一项调查和在全国进行一项调查,样本量的差别并不大。本量的差别并不大。总体规模越大,进行抽样调查的效率越高。总体规模越大,进行抽样调查的效率越高。u 若分类、分区、分层分别进行估计,如何处若分类、分区、分层分别进行估计,如何处理?理?u 对于多项目,如何处理?对于多项目,如何处理?其他影响因素n1.所研究问题目标量的个数n2.调查表的回收率 例如回收率估计为80%,则应接触的样本量为计算出所需样本量的1.25倍;n3.非抽样误差n4.资源限制n5.有效样本netc 定义:简单随机抽样的样本估计量的方差与复杂抽样的

    21、样本估 计 量的方差的比率。Deff Var()为复杂样本估计量的方差。)()(srsDVarVarD2.4 设计效果设计效果(Design effect,Deff)设计效应设计效应n基什(L.Kish)提出 比较不同抽样方法的效率.srsV ydeffVy不放回简单随机抽样简单估计量的方差 某个抽样设计在同样样本量条件下估计量的方差。Deff的作用:(1)评价抽样设计的一个依据,如果deff1,则抽样设计比简单随机抽样的效率低。(2)计算样本量如多阶段抽样的 Deff大约在22.5之间。n=n(deff)n为简单随机抽样所需样本量。n放回简单随机抽样的deff为:n 常用于复杂抽样样本量的确

    22、定;在一定精度条件下,简单随机抽样所需的样本量比较容易得到,复杂抽样的样本量为,nNNNnSnNNnSNdeff1)()()()1(22deffnn2.5 2.5 稀有事件的抽样问题抽样问题n如果估计的是非常稀有事件的比例,这时总体比例很小,用极限相对误差比极限绝对误差更好些。n 对于稀有事件,所需的样本量会很大,例如:3960001.01.099.0222221PrQtn760005.01.095.0222222PrQtn36001.01.09.0222223PrQtnn针对稀有事件并无法给出确切范围,n对总体比例事先不同的假定,所导致的样本量差异非常大。n霍丹(Haldane)提出的方法:n 即事先确定一个整数m(m1),进行逐个抽样,直到抽到m个所考虑特征的单元为止.n设n是实际的样本量,则P的一个无偏无偏估计为n当 n比较大,时 pmn1122)1()(mQmPpV10m11)()(mmmmQPpSpCv很接近于1 n规定了 或r、t后,就可以确定m。如规定 =20%,则m=27。n可以证明,这时所需样本量n的均值为 ptCvr)(pCv)(pCvPmnE)(

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:第2章-简单随机抽样课件.ppt
    链接地址:https://www.163wenku.com/p-4608000.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库