书签 分享 收藏 举报 版权申诉 / 81
上传文档赚钱

类型第二章抽样方法课件.pptx

  • 上传人(卖家):晟晟文业
  • 文档编号:5059074
  • 上传时间:2023-02-07
  • 格式:PPTX
  • 页数:81
  • 大小:320.34KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《第二章抽样方法课件.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    第二 抽样 方法 课件
    资源描述:

    1、2023年2月7日星期二第二章抽样方法第二章抽样方法第一节 抽样设计的基本知识案例:1、1936年,兰登总统中选2、1948年,杜鲁们总统中选3、1996年,美国总统大选效果:例1:某灯泡厂消费的灯泡10000只,怎样才干了解这批灯泡的运用寿命呢?例2:为了了解参与某种知识竞赛的1000名先生的效果,应采用什么样的抽样方法恰当?例3:一个单位的职工500人,其中不到35岁的有125人,35到49岁的有280人,50岁以上的有95人。为了了解这个单位职工与身体状况有关的某项目的,要从中抽取一个容量为100的样本。由于职工年龄与这项目的有关,试问:运用什么方法抽取?能在500人中恣意取100个吗?

    2、能将100个份额均分到这三局部中吗?一、抽样的基本术语抽样:是经过抽取总体中的局部单元,搜集这些单元的信息,运用数理统计的原理和方法,对总体停止推断的一种手腕。抽取样本总体推断总体样本1、总体与样本。总体是指研讨对象的全体,、总体与样本。总体是指研讨对象的全体,它是由研讨对象中的单元组成的。总体中单元的它是由研讨对象中的单元组成的。总体中单元的数目称作总体容量。数目称作总体容量。样本是从总体中依照一定方式抽取出的一局部样本是从总体中依照一定方式抽取出的一局部元素的集合。元素的集合。抽样比:指样本量抽样比:指样本量 n 与总体的容量与总体的容量N的比例的比例2、集体与抽样单位:、集体与抽样单位:

    3、集体是搜集信息的基本单位,即剖析单位。集集体是搜集信息的基本单位,即剖析单位。集体可以是人,也可以是家庭、组织、社区等,也体可以是人,也可以是家庭、组织、社区等,也可以是文明产物,例如文章、杂志、歌曲、词汇可以是文明产物,例如文章、杂志、歌曲、词汇等。等。抽样单位是一次直接的抽样所运用的基本单位。抽样单位是一次直接的抽样所运用的基本单位。二者比拟:A:集体与抽样单位在有些研讨中是相反的,有时又是不同的。与选用的抽样方法有关例如:从某省总数为12.8万人的大先生总体中,按一定方式抽取1000名大先生停止调查,单个的大先生既是构成某省12.8万名大先生的集体也就是我们所要剖析的对象,又是我们从总体

    4、中一次直接抽取1000名大先生的样本时所用的抽样单位。但是,当我们从这一总体中一次直接抽取出40个班级,而以这40个班级中的全部先生假定正好1000名作为我们的样本时,抽样单位班级与集体先生就不是一样的了。B:在实践抽样中,抽样单位往往是多层次的。例如:下面的例子,要抽取1000名先生,可先抽取假定干学校,然后从这些学校样本中抽取假定干班级,最后从班级样本中抽取先生样本。这时抽样单位是学校、班级、先生三种,区分称为初级抽样单位、次级抽样单位和终极抽样单位。3、抽样框又称抽样范围,它是指一次直接抽样时总体中一切抽样单位的名单。在一次抽样中,抽样框的数目是与抽样单位的层次相对应的。下面的例子中有三

    5、个层次的抽样单位:学校、班级、先生,那么对应的抽样框也应有三个:全部学校的名单、抽取的学校样本中的全部班级的名单、抽取班级中的一切先生的名单。4、参数值与统计值:参数值也称总体值,它是关于总体中某一变量的综合描画,或许说是总体中一切集体的某种特征的综合数量表现。在统计中最罕见的总体值是某一变量的平均值例如:平均年龄、平均支出等。总体值只要经过对总体中的每一个集体都停止调查或测量才干失掉。统计值也称样本值,它是关于样本中某一变量的综合描画,或许说是样本中一切集体的某种特征的综合数量表现。样本值是从样本的一切集体中计算出来的,它是相应的总体值的估量量。抽样的目的之一,就是经过这些样本值去估量和推断

    6、各种总体值。抽样设计的目的,就是尽能够使所抽取的样本的估量量接近总体的参数值。5、抽样误差:总体的异质性和样本与总体范围的差异性,在用样本的统计值去推算总体的参数值时总会有偏向,这种偏向就是抽样误差。它是样本代表性大小的一个规范。当总体相当大时,能够被抽取的样本十分多,不能够列出一切的实践抽样误差,而用平均抽样误差来表征各样本实践抽样误差的平均水平。抽样误差是指样本目的值与被推断的总体目的值之差。主要包括:样本平均数与总体平均数之差;样本成数与总体成数之差。抽样误差的来源:1、登忘性误差;2、代表性误差:A、系统性误差;B、偶然性误差,抽样误差特指偶然性误差。影响抽样误差的要素:抽样单位数的多

    7、少,总体中被研讨标志的变化水平的大小。6、置信水平与置信区间:置信水平是指总体参数值落在样本统计值某一正负区间的概率。置信区间是指某一置信水平下,样本统计值与总体参数值的误差范围。在样本量相反的状况下,置信水平越高,置信区间越宽。在置信区间不变的状况下,样本量越多,置信水平越高 例:美国Gallup盖洛普公司就消费者对美国产质量量的看法,对美国、德国和日本三国合计3,500名消费者每个国度约1,200名区分停止了调查,调查结果:有55%的美国人以为美国产质量量好,而只要26%的德国人和17%的日自己持异样看法。抽样误差为3,置信水平为95。那么这三个国度消费者的置信区间区分为:国别 样本均值

    8、抽样误差 置信 区 间 美国 55%3%5258 德国 26%3 2329 日本 17%3 1420二、抽样的基本顺序1界定总体界定总体就是在详细抽样前,明白从中抽取样本的总体的范围与界限。2决议抽样方法各种不同的抽样方法都有自身的特点和适用范围。因此,我们在详细实施抽样之前,应依据调查研讨的目的、界定的总体范围、要求确定样本的规模和要求量化的准确水平来决议详细采用哪种抽样方法。3设计抽样方案 4制定抽样框制定抽样框就是依据曾经明白界定的总体范围,搜集总体中全部抽样单位的名单,并一致编号。5实践抽取样本实践抽取样本就是在上述几个步骤的基础上,严厉依照所选定的抽样方法,从抽样框中抽取一个个的抽样

    9、单位,构成样本。6样本评价 样本评价就是对样本的质量和代表性停止检验,其目的是防止因样本的偏向过大而招致的失误。三、抽样的原那么1、目的性原那么。目的性原那么是指在停止抽样方案设计时,要以课题研讨的总体方案和研讨的目的为依据。以研讨的效果为动身点,从最有利于研讨资料的获取,以及最契合研讨的目的等因历来思索抽样方案和抽样方法的设计。2、可测性原那么。可测性原那么指的是抽样设计可以从样本自身计算出有效的估量或许抽样变化的近似值。在研讨中通常用规范误来表示。通常,只要概率样本在客观上才是可测的,即概率样本可以计算出有效的估量值或抽样变化的近似值。但是,概率抽样也并不自动保证可测性。比如,从一个具有周

    10、期性变化的总体中选出一个系统样本,就不能保证这种可测性。3、可行性原那么。可行性原那么是指研讨者所设计的抽样发难必需在时间上实在可行。它意味着研讨者所设计的方案可以预料实践抽样进程中所能够出现的各种效果,并设计了处置这些效果的方法。4、经济性原那么。经济性原那么主要指的是抽样方案的设计要与研讨的可得资源相顺应。这种资源主要包括研讨的经费、时间、人力等。目的性原那么和可行性原那么是首要的。抽样设计要效劳于研讨的目的,这是设计的动身点和基本目的。而可行性原那么是设计方案自得完成的前提和保证。而可测性原那么和经济性原那么在一定水平上是相矛盾的。当为了增加误差添加样本的容量时,又同时意味着要添加抽样所

    11、需的资源。四、抽样的类型 复杂随机抽样 分层抽样 随机抽样 系统抽样 等概率抽样 整群抽样 多段抽样抽样方法 偶遇抽样 立意抽样 非随机抽样 配额抽样 不等概率抽样 雪球抽样 第二节 随机抽样技术一、复杂随机抽样一、复杂随机抽样定义:复杂随机抽样又称纯随机抽样,定义:复杂随机抽样又称纯随机抽样,是指在特定总体的一切单位是指在特定总体的一切单位N中,不加条件中,不加条件随机抽取随机抽取n个单元为样本,每个单元都有异个单元为样本,每个单元都有异样的概率被抽中的抽样方法。样的概率被抽中的抽样方法。总体总量和总体均值总体总量和总体均值NiiYY1NiiyNNYY11复杂随机抽样分为重复抽样和不重复抽样

    12、两类。常用的复杂随机抽样方法:直接抽样法、抽签法和随机数表法。直接抽样法、抽签法适用于总体规模稍小的抽样;随机数表法是用随机数表来抽样的方法,适用于总体规模稍大的抽样。详细步骤:1先取得一份总体一切元素的名单即抽样框;2将总体中一切元素逐一按顺序编号;3依据总体规模是几位数来确定从随机数表中选几位数码;4以总体的规模为规范,对随机数表中的数码逐一停止权衡并决议取舍;5依据样本规模的要求选出足够的数码个数;6依据从随机数表中选出的数码,到抽样框中去找出它所对应的元素。例如:N=528,即总体中有528个集体,我们从中选10个样本。解:首先在表中随机抽取三列,然后依照一定的顺序选出10个从001到

    13、528之间不同的数。例2:要调查某公司消费的500克袋装牛奶的质量知否达标,现从800袋牛奶中抽取60袋停止检验,应用随机数表抽取样本,假设从随机数表第8行第7列的数末尾向右读,请你依次写出最先检验的5袋牛奶的的编号为?解:先将800袋牛奶按000,001,799停止编号。下面摘取随机数表的第7行至第9行:第7行:84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76第8行:63 01 63 78 59 16 95 56 67 19 98 10 50 71 75 12 86 73 58 07 44 3

    14、9 52 38 79第9行:33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54第8行第7列为7,由于是用三位数编号XXX,所以取3个数,既第一个被取出的编号为785,第二个取出916,由于916大于799,所以舍去,再往后取,955,也舍去;667,199,810舍去,507,175 所以最先检验的5袋牛乃编号为:785,667,199,507,175 复杂随机抽样的特点:优点:没有人为要素的搅扰,复杂易行,是概率抽样的理想类型。局限性:1、在总体同质性较高时,用来比拟准确有效,但在总体异质性较高

    15、时,那么不一定效果好。这是由于当构成总体的集体差异较大时,用复杂随机抽样方法抽出的样本由于在总体中的散布不一定平均,所以很能够误差较大,不能很好地说明总体的性质和特征。2、当总体所含集体数目太多时,采用这种抽样方式不只费时、费力、费钱,而且很难操作。二、分层抽样定义:在抽样之前将总体分为同质的、互不堆叠的假定干子总体,也称为层。然后在每一个层独立地随机抽取样本。分层抽样表示图依照确定分层样本数量的不同方式,分层抽样分为比例分层抽样和非比例分层抽样两种。1、比例分类抽样是指分类样本在总体样本中所占比例与该类一切单位在总体中所占比例相反;2、非比例分配法。当某个层次包括的个案数在总体中所占比例太小

    16、时,为使该层的特征在样本中失掉足够的反映,可人为地适当添加该层样本数在总体样本中的比例。但这样做会添加推论的复杂性。优点:1、分类抽样可以克制复杂随机抽样的缺陷,适用于总体内集体数目较多,结构较复杂,外部差异较大的状况。2、准确度较高。3、便于对不同层面的效果停止探求。4、便于分工,使任务效率提高。缺陷:如何分类通常由人们客观判定,因此要求调查者具有较高的素质与才干,并且必需事前对总体各单位的状况有较多的了解,而它们在实践任务中有时难以完全完成,这就会影响分类的迷信性和准确性。三、系统抽样1、定义:又称等距抽样或机械抽样,对研讨的总体按一定的顺序陈列,每隔一定的距离抽取一个单元的抽样方法。其做

    17、法是先编制抽样框,将总体的一切单位都按一定标志陈列编号;再用总体的单位数除以样本的单位数,求得抽样间距;然后,在第一个抽样间距内随机抽出第一个样本单位,作为抽样的终点;接着,依照抽样间距依次抽取样本单位,直到抽足样本的单位数为止。抽选方法:设总体单元数为N,要抽n个单元为样本,先计算抽样距离k=N/n,在1到k之间抽取一个随机终点r,那么被抽中单元的顺序位置是:r,r+k,r+2k,。当N不能被n整除时,采用圆形系统抽样方法。2、系统抽样的优点1没有抽样框时可替代复杂随机抽样方法复杂;2不需求辅佐的抽样框信息;3样本的散布比拟好;估量值容易计算。3、系统抽样的缺陷 1假定抽样距离与总体的某种周

    18、期性变化分歧,会得一个差的样本;2不运用辅佐信息使抽样效率不高;3运用概念框时,不能预先知道样本量;4没有一个无偏的方差估量量;5当N不能被n整除时会失掉样本量不同的样本。我们国度的国度统计局的调查多采用系统抽样,它便于操作例:从600名大先生中抽选50名大先生停止调查,可以应用学校现有名册按顺序编号排序,从第001号编至600号。抽选距离 N/n 600/50 12人 如从第一个12人中用复杂随机抽样方式,抽取第一个样本单位,如抽到的是8号,依次抽出的是20号,32号,44号等。四、整群抽样定义:整群抽样又称聚类抽样或团体抽样,是将总体依照某种规范划分为一些群体,每一个群体为一个抽样单位,再

    19、用随机的方法从这些群体中抽取假定干群体,并将所抽出群体中的一切集体集合为总体的样本。整群抽样表示图:黄色为总体红色为群白点为基本单元整群抽样的优点:1能大大减低搜集数据的费用;2当总体单元自然构成的群时,容易取得抽样框,抽样也更容易;3当群内单元差异大,而不同群之间的差异小时,可以提高效率。缺陷:1假定群内个单元有趋异性,效率将会降低;2通常无法预先知道总样本量,由于不知道群内有多少单元;3方差估量比复杂随机抽样更为复杂可以综合应用分层和整群抽样技术,采取分层整群抽样,比如人体尺寸调查,采用分层提高样本代表性,采用整群抽样,便于数据的搜集。五、多阶抽样定义:多阶段抽样又称多级抽样或分段抽样,就

    20、是把从总体中抽取样本的进程分红两个或多个阶段停止的抽样方法。多阶抽样表示图:总体第一阶样本最终样本多阶段抽样是在总体内集体单位数量较大,而彼此间的差异不太大时,先将总体各单位按一定标志分红假定干群体,作为抽样的第1阶段单位,并依照随机原那么,从中抽出假定干群体作为第1阶段样本;然后将第1阶段样本又分红假定干小群体,作为抽样的第2阶段单位,从中抽出假定干群体作为第2阶段样本,依此类推,可以有第3阶段、第4阶段直到满足需求为止。最末阶段抽出的样本单位的集合,就是最终构成的总体样本。如对某乡镇20000人要抽取500人的抽样可分为三段停止:A、某县25个乡抽取10个乡 B、从10个乡中抽取15个村

    21、C、从15个村中抽取500人。整个进程的各段抽样,都可采取复杂的或分层的抽样法。该例详细的进程中有三段,那么可称为三段抽样。详细分段可依据实践停止。这种方法,在大规模调查时非用它不可。但由于每段抽样都会有误差,经过多段抽样,最后抽出来的样本误差就会比拟大,这是多段抽样的缺陷。优点:1当群具有同质性时,多阶抽样的效率高于整群抽样;2样本的散布比复杂随机抽样集中,采用面访可以浪费时间和费用;3不需求整个总体单元的名录框,只需群的名录框和抽中群的单元名录框。缺陷:1效率不如复杂随机抽样;2通常不能提早知道最终的样本量;3调查的组织较整群抽样复杂;4估量值与抽样方差的计算较为复杂。例题1:为检测某种产

    22、品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,二级品8件,三级品13件,次品4件。1样本的频率散布表;2画出表示样本频率散布的条形图。3依据上述结果,估量此产品为二级品或三级品的概率约是多少?解:1样品的频率散布表为:产 品频 数频 率一 级 品 5 0.17 二 级 品 8 0.27 三 级 品 13 0.43 次 品 4 0.13(2)样品频率散布的条形图:3此产品为二级品或三级品的概率约为0.27+0.43=0.7。例2:为了了解参与某种知识竞赛的1000名先生的效果,应采用什么样的抽样方法恰当?解:适宜选用系统抽样,抽样进程如下:1随机将这1000名先生编号为1,2,3,

    23、1000比如可以应用准考证号。2将总体按编号顺序平均分红50局部,每局部包括20个集体。3在第一局部的集体编号1,2,20中,应用复杂随机抽样抽取一个号码,比如是18。4以18为起始号,每距离20抽取一个号码,这样就失掉一个容量为50的样本:18,38,58,978,998。讨论:1问:在系统抽样中,每个集体被抽中的概率能否一样?2假设集体总数不能被样本容量整除时的处置方法是什么?先从总体中随机地剔除余数可用随机数表,再按系统抽样方法往下停止。每个被抽到的概率能否一样?例3:为了经过50个同窗的效果了解参与某种知识竞赛的1003名先生的效果,应采用什么样的抽样方法恰当?解:1随机将这1003个

    24、集体停止编号1,2,3,1003。2应用复杂随机抽样,先从总体中剔除3个集体可以随机数表法,剩下的集体数1000统统被50整除,然后按系统抽样的方法停止。讨论:总体中的每个集体被剔除的概率是相等的 ,也就是每个集体不被剔除的概率相等 采用系统抽样时每个集体被抽取的概率都是 ,所以在整个抽样进程中每个集体被抽取的概率仍相等,都是:310031000100350100010005050100310001003例4 :某单位有老年人28 人,中年人54人,青年人81人,为了调查他们的身体状况的某项目的,需从他们中间抽取一个容量为36样本,适宜的抽取样本的方法是 ()A.复杂的随机抽样 B.系统抽样

    25、C.先从老年中扫除一人,再用分层抽样 D.分层抽样练习:1、某学校现有职工140人,其中教员91人,教辅行政人员28人,总务后勤人员21人。为了了解职工的某种状况,要从中抽取一个容量为20的样本,试用复杂随机抽样、系统抽样、分层抽样区分表达抽取的方法。2、一个工厂有假定干个车间,今采用分层抽样的方法从全厂某天的2048件新产品中抽取一个容量为128的样本停止质量反省。假定一车间这一天消费256产品,那么从该车间抽取的产品数是多少?3、某商业银行预备展开储户投资意向调查,但是其客户总数多达20万,无法逐一停止访问,试设计一份抽样方案,以便抽出适宜的样本群体,停止调查。第三节 非随机抽样技术 非随

    26、机抽样又称为不等概率抽样或客观抽样,就是调查者依据自己的方便或客观判别抽取样本的方法。它不是严厉按随机抽样原那么来抽取样本,所以失掉了大数定律的存在基础,也就无法确定抽样误差,无法正确地说明样本的统计值在多大水平上适宜于总体。虽然依据样本调查的结果也可在一定水平上说明总体的性质、特征,但不能从数量上推断总体。一、偶遇抽样 偶遇抽样又叫自然抽样、方便抽样或便利抽样,是调查者将在一定时间、一定环境里所能遇见到或接触到的人作为样本的方法。详细说就是调查者依据自己的方便,恣意抽取偶然遇到的人或许选择那些离自己最近的、最容易找到的人作为样本。二、目的抽样目的抽样又叫判别抽样或立意抽样,是调查者依据研讨的

    27、目的和自己客观的剖析,来选择和确定样本的方法。它又可分为印象判别抽样和阅历判别抽样两种。三、配额抽样配额抽样又叫定额抽样,是先依据总体各个组成局部所包括的抽样单位的比例分配样本数额,然后由调查者在各个组成局部外依据配额的多少采用客观的抽样方法抽取样本。定额抽样与概率抽样中的分类抽样、整群抽样都是依据某些特征对总体停止分类,但配额抽样注重的是样本与总体在结构比例上的外表分歧性而不是实质特征上的外局部歧性。所以往往照顾不到总体单位之间的差异性。关于那些单位众多、扑朔迷离、状况不时更新的调查总体而言,配额抽样的样本很能够出现较大的误差,因此,依据定额抽样样本调查的结果是不能推论较大总体的,即使在较小

    28、的调查研讨中,要用定额抽样调查的结果推论总体,也应慎重从事。它普通不是用于说明总体状况,而是用于检验实际、说明关系、比拟不同等。四、滚雪球抽样滚雪球是一种笼统比喻的说法,它是指先找大批的、甚至一般的调查对象停止访问,然后经过他们再去寻觅新的调查对象,依次类推,就像滚雪球一样越来越大,直至到达调查目的为止。滚雪球抽样适用于总体的集体信息不充沛或难以取得,不能运用其它抽样方法抽取样本的调查研讨。滚雪球抽样用于某一特殊群体的调查往往可以收到奇效。但是,当总体规模较大时,有许多集体就无法找到;有时调查对象会出于某种思索故意漏掉一些重要集体,这都能够招致抽样样本发生误差,无法正确反映总体状况。非概率抽样

    29、不是依照概率均等的原那么,而是依据人们的客观阅历和便利条件来抽取样本,每个集体进入样本的概率是未知的,无法说明样天分否重现了总体的结构,所以,其样本的代表性往往较小,误差有时相当大并且无法估量,用这样的样本推论总体是不牢靠的。优势:1、在很多状况下,严厉的随机抽样无法停止或没有必要,例如,在人流涌动的车站、商店、广场、街道等许多场所,不允许调查者冷静地随机抽样;对诸如吸毒者之类的特殊社会群体无法确定调查总体,也就无法随机抽取样本;有时调查的目的只是要对总体作最普通的了解和接触或做某些片面的研讨,没必要采用随机抽样;由于调查者的时间,人力,物力缺乏,有力停止随机抽样,等等。在这些状况下,就只能采

    30、用非概率抽样。2、随机抽样为了保证概率原那么,对抽样的操作进程要求严厉,实施起来比拟费事,费时费财费力,而非概率抽样操作便捷,省钱省时省力,统计上也远较概率抽样复杂,因此假设调查的目的允许,而且调查者对调查总体有较好的了解,那么采用非概率抽样就不失为一种更好的选择。复杂随机抽样中推论总体均值的样本规模计算公式1是:n=t22/e2,其中,t为置信度所对应的临界值,为总体的规范差,e为抽样误差。推论总体成数或百分比的样本规模计算公式2为:n=t21/e2其中为总体的成数或百分比,t为置信度所对应的临界值,e为抽样误差。第四节 样本容量确实定 通常选择样本容量的方法是首先规则所需求的精度,然后确定

    31、满足精度的最小的样本容量。这里,精度触及近似置信区间的大小,较小的置信区间可以提供较高的精度。因此,近似置信区间的大小依赖于允许误差B,即选择精度水平相当于选择B的值。一、估量总体均值时,选择所必需的样本容量的方法。均值的规范误差的估量公式,即:例:某大学有5 000名毕业生,欲对他们的年薪状况停止调查,我们想结构宽度在1000美元之内的近似95的置信区间。对这样规则的置信区间,B500。假定依据去年所做的异样研讨,得知s3 000美元。我们可以用这个值来估量。试计算该调查应采用的样本容量。解依据B=500、s3 000 及N5 000,依据式7-12,那么样本容量为:复杂随机抽样中推论总体均

    32、值的样本规模计算公式是:n=t22/e2,其中,t为置信度所对应的临界值,为总体的规范差,e为抽样误差。二、推论总体成数或百分比的样本规模计算公式:n=t21/e2其中为总体的成数或百分比,t为置信度所对应的临界值,e为抽样误差。例1、某学校预备采用抽样调查了解先生每周用于文体活动的时间。置信度为0.9,允许误差在1小时之内,求所需求的样本容量。规范差为5。依据题意,采用公式1n=t22/e2,1=0.9 所以t=1.65 =5小时,所以1 n=t22/2=(1.65)2(5)2/1=68(人)例2、电视台为了解戏曲节目的收看率,拟停止一次抽样调查。依据50户的试调查,收看率为68%。现要求抽

    33、样调查的结果,误差不超越5%,置信度为0.95,求所需求样本容量?依据题意,此题采用成数样本容量公式 n=t21/2 因1=0.9所以t=1.96 p=0.68依据试调查=0.05 n=t21/2=(1.95)20.68(1-0.68)/(0.05)2334(户)在上述计算公式中,由于置信度是事前确定的,所以其临界值t可从规范正态散布表中查出,e也是研讨者依据需求先确定的,但总体的规范差、成数或百分比却往往是难以失掉的它们通常是研讨所需求求的。因此,在实践抽样进程中,研讨者往往无法直接运用上述公式计算所需的样本规模,而只能采取某种变通的方法。比如,应用先人所作的关于同一总体的普查或抽样调查资料,来计算或估量总体方差,由此得出推论总体均值的样本规模。在计算推论总体成数或百分比的样本规模时,我们留意到1-在=0.5时到达最大值,因此,即使我们对一无所知,也可以采取比拟保险的方法,取=0.5,这样1-=0.25=1/4,上式变为n=t2/4e2。它可以保证样本规模足够大。抽样误差就是样本统计值与总体参数值之间存在的偏向。它是由于抽样自身的随机性所惹起的误差。无论采取什么样的抽样方式,这种误差都是不可防止的。留意:1由于关于较小的样原本说,样本规模上的很小的一点添加,便会带来准确性方面很清楚的添加。2关于较大的样原本说,异样添加相反的个案,却收效甚微。

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:第二章抽样方法课件.pptx
    链接地址:https://www.163wenku.com/p-5059074.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库