第二章抽样方法课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第二章抽样方法课件.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第二 抽样 方法 课件
- 资源描述:
-
1、2023年2月7日星期二第二章抽样方法第二章抽样方法第一节 抽样设计的基本知识案例:1、1936年,兰登总统中选2、1948年,杜鲁们总统中选3、1996年,美国总统大选效果:例1:某灯泡厂消费的灯泡10000只,怎样才干了解这批灯泡的运用寿命呢?例2:为了了解参与某种知识竞赛的1000名先生的效果,应采用什么样的抽样方法恰当?例3:一个单位的职工500人,其中不到35岁的有125人,35到49岁的有280人,50岁以上的有95人。为了了解这个单位职工与身体状况有关的某项目的,要从中抽取一个容量为100的样本。由于职工年龄与这项目的有关,试问:运用什么方法抽取?能在500人中恣意取100个吗?
2、能将100个份额均分到这三局部中吗?一、抽样的基本术语抽样:是经过抽取总体中的局部单元,搜集这些单元的信息,运用数理统计的原理和方法,对总体停止推断的一种手腕。抽取样本总体推断总体样本1、总体与样本。总体是指研讨对象的全体,、总体与样本。总体是指研讨对象的全体,它是由研讨对象中的单元组成的。总体中单元的它是由研讨对象中的单元组成的。总体中单元的数目称作总体容量。数目称作总体容量。样本是从总体中依照一定方式抽取出的一局部样本是从总体中依照一定方式抽取出的一局部元素的集合。元素的集合。抽样比:指样本量抽样比:指样本量 n 与总体的容量与总体的容量N的比例的比例2、集体与抽样单位:、集体与抽样单位:
3、集体是搜集信息的基本单位,即剖析单位。集集体是搜集信息的基本单位,即剖析单位。集体可以是人,也可以是家庭、组织、社区等,也体可以是人,也可以是家庭、组织、社区等,也可以是文明产物,例如文章、杂志、歌曲、词汇可以是文明产物,例如文章、杂志、歌曲、词汇等。等。抽样单位是一次直接的抽样所运用的基本单位。抽样单位是一次直接的抽样所运用的基本单位。二者比拟:A:集体与抽样单位在有些研讨中是相反的,有时又是不同的。与选用的抽样方法有关例如:从某省总数为12.8万人的大先生总体中,按一定方式抽取1000名大先生停止调查,单个的大先生既是构成某省12.8万名大先生的集体也就是我们所要剖析的对象,又是我们从总体
4、中一次直接抽取1000名大先生的样本时所用的抽样单位。但是,当我们从这一总体中一次直接抽取出40个班级,而以这40个班级中的全部先生假定正好1000名作为我们的样本时,抽样单位班级与集体先生就不是一样的了。B:在实践抽样中,抽样单位往往是多层次的。例如:下面的例子,要抽取1000名先生,可先抽取假定干学校,然后从这些学校样本中抽取假定干班级,最后从班级样本中抽取先生样本。这时抽样单位是学校、班级、先生三种,区分称为初级抽样单位、次级抽样单位和终极抽样单位。3、抽样框又称抽样范围,它是指一次直接抽样时总体中一切抽样单位的名单。在一次抽样中,抽样框的数目是与抽样单位的层次相对应的。下面的例子中有三
5、个层次的抽样单位:学校、班级、先生,那么对应的抽样框也应有三个:全部学校的名单、抽取的学校样本中的全部班级的名单、抽取班级中的一切先生的名单。4、参数值与统计值:参数值也称总体值,它是关于总体中某一变量的综合描画,或许说是总体中一切集体的某种特征的综合数量表现。在统计中最罕见的总体值是某一变量的平均值例如:平均年龄、平均支出等。总体值只要经过对总体中的每一个集体都停止调查或测量才干失掉。统计值也称样本值,它是关于样本中某一变量的综合描画,或许说是样本中一切集体的某种特征的综合数量表现。样本值是从样本的一切集体中计算出来的,它是相应的总体值的估量量。抽样的目的之一,就是经过这些样本值去估量和推断
6、各种总体值。抽样设计的目的,就是尽能够使所抽取的样本的估量量接近总体的参数值。5、抽样误差:总体的异质性和样本与总体范围的差异性,在用样本的统计值去推算总体的参数值时总会有偏向,这种偏向就是抽样误差。它是样本代表性大小的一个规范。当总体相当大时,能够被抽取的样本十分多,不能够列出一切的实践抽样误差,而用平均抽样误差来表征各样本实践抽样误差的平均水平。抽样误差是指样本目的值与被推断的总体目的值之差。主要包括:样本平均数与总体平均数之差;样本成数与总体成数之差。抽样误差的来源:1、登忘性误差;2、代表性误差:A、系统性误差;B、偶然性误差,抽样误差特指偶然性误差。影响抽样误差的要素:抽样单位数的多
7、少,总体中被研讨标志的变化水平的大小。6、置信水平与置信区间:置信水平是指总体参数值落在样本统计值某一正负区间的概率。置信区间是指某一置信水平下,样本统计值与总体参数值的误差范围。在样本量相反的状况下,置信水平越高,置信区间越宽。在置信区间不变的状况下,样本量越多,置信水平越高 例:美国Gallup盖洛普公司就消费者对美国产质量量的看法,对美国、德国和日本三国合计3,500名消费者每个国度约1,200名区分停止了调查,调查结果:有55%的美国人以为美国产质量量好,而只要26%的德国人和17%的日自己持异样看法。抽样误差为3,置信水平为95。那么这三个国度消费者的置信区间区分为:国别 样本均值
8、抽样误差 置信 区 间 美国 55%3%5258 德国 26%3 2329 日本 17%3 1420二、抽样的基本顺序1界定总体界定总体就是在详细抽样前,明白从中抽取样本的总体的范围与界限。2决议抽样方法各种不同的抽样方法都有自身的特点和适用范围。因此,我们在详细实施抽样之前,应依据调查研讨的目的、界定的总体范围、要求确定样本的规模和要求量化的准确水平来决议详细采用哪种抽样方法。3设计抽样方案 4制定抽样框制定抽样框就是依据曾经明白界定的总体范围,搜集总体中全部抽样单位的名单,并一致编号。5实践抽取样本实践抽取样本就是在上述几个步骤的基础上,严厉依照所选定的抽样方法,从抽样框中抽取一个个的抽样
9、单位,构成样本。6样本评价 样本评价就是对样本的质量和代表性停止检验,其目的是防止因样本的偏向过大而招致的失误。三、抽样的原那么1、目的性原那么。目的性原那么是指在停止抽样方案设计时,要以课题研讨的总体方案和研讨的目的为依据。以研讨的效果为动身点,从最有利于研讨资料的获取,以及最契合研讨的目的等因历来思索抽样方案和抽样方法的设计。2、可测性原那么。可测性原那么指的是抽样设计可以从样本自身计算出有效的估量或许抽样变化的近似值。在研讨中通常用规范误来表示。通常,只要概率样本在客观上才是可测的,即概率样本可以计算出有效的估量值或抽样变化的近似值。但是,概率抽样也并不自动保证可测性。比如,从一个具有周
10、期性变化的总体中选出一个系统样本,就不能保证这种可测性。3、可行性原那么。可行性原那么是指研讨者所设计的抽样发难必需在时间上实在可行。它意味着研讨者所设计的方案可以预料实践抽样进程中所能够出现的各种效果,并设计了处置这些效果的方法。4、经济性原那么。经济性原那么主要指的是抽样方案的设计要与研讨的可得资源相顺应。这种资源主要包括研讨的经费、时间、人力等。目的性原那么和可行性原那么是首要的。抽样设计要效劳于研讨的目的,这是设计的动身点和基本目的。而可行性原那么是设计方案自得完成的前提和保证。而可测性原那么和经济性原那么在一定水平上是相矛盾的。当为了增加误差添加样本的容量时,又同时意味着要添加抽样所
11、需的资源。四、抽样的类型 复杂随机抽样 分层抽样 随机抽样 系统抽样 等概率抽样 整群抽样 多段抽样抽样方法 偶遇抽样 立意抽样 非随机抽样 配额抽样 不等概率抽样 雪球抽样 第二节 随机抽样技术一、复杂随机抽样一、复杂随机抽样定义:复杂随机抽样又称纯随机抽样,定义:复杂随机抽样又称纯随机抽样,是指在特定总体的一切单位是指在特定总体的一切单位N中,不加条件中,不加条件随机抽取随机抽取n个单元为样本,每个单元都有异个单元为样本,每个单元都有异样的概率被抽中的抽样方法。样的概率被抽中的抽样方法。总体总量和总体均值总体总量和总体均值NiiYY1NiiyNNYY11复杂随机抽样分为重复抽样和不重复抽样
12、两类。常用的复杂随机抽样方法:直接抽样法、抽签法和随机数表法。直接抽样法、抽签法适用于总体规模稍小的抽样;随机数表法是用随机数表来抽样的方法,适用于总体规模稍大的抽样。详细步骤:1先取得一份总体一切元素的名单即抽样框;2将总体中一切元素逐一按顺序编号;3依据总体规模是几位数来确定从随机数表中选几位数码;4以总体的规模为规范,对随机数表中的数码逐一停止权衡并决议取舍;5依据样本规模的要求选出足够的数码个数;6依据从随机数表中选出的数码,到抽样框中去找出它所对应的元素。例如:N=528,即总体中有528个集体,我们从中选10个样本。解:首先在表中随机抽取三列,然后依照一定的顺序选出10个从001到
13、528之间不同的数。例2:要调查某公司消费的500克袋装牛奶的质量知否达标,现从800袋牛奶中抽取60袋停止检验,应用随机数表抽取样本,假设从随机数表第8行第7列的数末尾向右读,请你依次写出最先检验的5袋牛奶的的编号为?解:先将800袋牛奶按000,001,799停止编号。下面摘取随机数表的第7行至第9行:第7行:84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76第8行:63 01 63 78 59 16 95 56 67 19 98 10 50 71 75 12 86 73 58 07 44 3
14、9 52 38 79第9行:33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54第8行第7列为7,由于是用三位数编号XXX,所以取3个数,既第一个被取出的编号为785,第二个取出916,由于916大于799,所以舍去,再往后取,955,也舍去;667,199,810舍去,507,175 所以最先检验的5袋牛乃编号为:785,667,199,507,175 复杂随机抽样的特点:优点:没有人为要素的搅扰,复杂易行,是概率抽样的理想类型。局限性:1、在总体同质性较高时,用来比拟准确有效,但在总体异质性较高
15、时,那么不一定效果好。这是由于当构成总体的集体差异较大时,用复杂随机抽样方法抽出的样本由于在总体中的散布不一定平均,所以很能够误差较大,不能很好地说明总体的性质和特征。2、当总体所含集体数目太多时,采用这种抽样方式不只费时、费力、费钱,而且很难操作。二、分层抽样定义:在抽样之前将总体分为同质的、互不堆叠的假定干子总体,也称为层。然后在每一个层独立地随机抽取样本。分层抽样表示图依照确定分层样本数量的不同方式,分层抽样分为比例分层抽样和非比例分层抽样两种。1、比例分类抽样是指分类样本在总体样本中所占比例与该类一切单位在总体中所占比例相反;2、非比例分配法。当某个层次包括的个案数在总体中所占比例太小
16、时,为使该层的特征在样本中失掉足够的反映,可人为地适当添加该层样本数在总体样本中的比例。但这样做会添加推论的复杂性。优点:1、分类抽样可以克制复杂随机抽样的缺陷,适用于总体内集体数目较多,结构较复杂,外部差异较大的状况。2、准确度较高。3、便于对不同层面的效果停止探求。4、便于分工,使任务效率提高。缺陷:如何分类通常由人们客观判定,因此要求调查者具有较高的素质与才干,并且必需事前对总体各单位的状况有较多的了解,而它们在实践任务中有时难以完全完成,这就会影响分类的迷信性和准确性。三、系统抽样1、定义:又称等距抽样或机械抽样,对研讨的总体按一定的顺序陈列,每隔一定的距离抽取一个单元的抽样方法。其做
展开阅读全文