社会调查与研究方法第三章课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《社会调查与研究方法第三章课件.pptx》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 社会调查 研究 方法 第三 课件
- 资源描述:
-
1、第三章第三章 抽样方法抽样方法1抽样与抽样调查抽样的类型与抽样程序2 概率抽样34非概率抽样样本容量的确定5第一节第一节 抽样与抽样调查抽样与抽样调查一、抽样的相关概念总总体体样样本本抽抽样单样单位位1 1、总体和总体单位(元素)、总体和总体单位(元素)目标总体:目标总体:所研究的全部个体(元素)的集合所研究的全部个体(元素)的集合 调查总体:调查总体:是研究者从中实际抽取调查样本的个体的集合是研究者从中实际抽取调查样本的个体的集合体,它往往是对研究总体的进一步体,它往往是对研究总体的进一步界定。实际上界定。实际上,样本是,样本是从调查总体中而不是从研究总体中抽取的从调查总体中而不是从研究总体
2、中抽取的。总体单位(元素总体单位(元素)2 2、样本、样本3 3、抽样、抽样:从总体中按一定方式选择或抽取样本的过程从总体中按一定方式选择或抽取样本的过程。4 4、抽样单位:、抽样单位:一次直接的抽样所使用的基本单位。一次直接的抽样所使用的基本单位。5 5、抽样框、抽样框:又称做抽样范围,指的是一次直接抽样时总体又称做抽样范围,指的是一次直接抽样时总体中所有抽样单位的名单。中所有抽样单位的名单。6 6、参数值与统计值、参数值与统计值7 7、抽样误差:抽样误差:总体的异质性和样本与总体范围的差异性,总体的异质性和样本与总体范围的差异性,在用样本的统计值去推算总体的参数值时总会有偏差,这在用样本的
3、统计值去推算总体的参数值时总会有偏差,这种偏差就是抽样误差。种偏差就是抽样误差。8 8、置信水平和置信区间:置信水平和置信区间:置信水平是指总体参数值落在样置信水平是指总体参数值落在样本统计值某一正负区间内的概率,而置信区间是指在某一本统计值某一正负区间内的概率,而置信区间是指在某一置信水平下,样本统计值与总体参数值的误差范围。置信水平下,样本统计值与总体参数值的误差范围。提供一种实现提供一种实现“由部分认识总体由部分认识总体”的目标和途径的目标和途径里根蒙代尔时代扬基拉维齐6436今日美国黑蛇发女怪6337哥伦比亚广播公司纽约时代周刊6139盖洛普民意测验新闻周刊5941实际投票结果5941
4、1984年美国总统选举预测与实际结果年美国总统选举预测与实际结果比较比较二、抽样的作用调查对调查对象不到象不到2000人人 1、普查 是普遍调查或全面调查的简称,是指对研究对象的全体进行无一例外的逐个调查。它是最全面、最准确的调查类型,其目的是把握某一时期的一定范围的社会现象的总体情况。2、抽样调查 从调查对象的总体中,按照一定的方式选出一部分个体进行调查,并通过所选样本的情况来推论总体状况,也就是从“点”到“面”,用部分反映整体。三、抽样调查三、抽样调查总体抽样样本总总体体与样与样本本抽抽样调查样调查的特点的特点优点:优点:(1 1)人力、物力财力花费少于普查;)人力、物力财力花费少于普查;
5、(2 2)应用范围广;)应用范围广;(3 3)时间短,但准确性也有保证;调查项目多,)时间短,但准确性也有保证;调查项目多,收集信息丰富。收集信息丰富。抽样调查的抽样调查的局限性:局限性:对于调查总体尚不清楚、不明晰的调查对象,对于调查总体尚不清楚、不明晰的调查对象,就很难进行抽样调查;就很难进行抽样调查;同个案调查比较,抽样调查的样本单位一般同个案调查比较,抽样调查的样本单位一般 较多,往往会影响调查的深度,因此用于定较多,往往会影响调查的深度,因此用于定 量研究非常适宜,用于定性研究则要非常慎量研究非常适宜,用于定性研究则要非常慎 重;重;抽样调查需要一定的数学知识和计算机使用抽样调查需要
6、一定的数学知识和计算机使用 能力。能力。例:例:1936年美年美国总统国总统大大选选的民意的民意测验测验 总体选举投票前,总体选举投票前,文摘文摘杂志寄出杂志寄出1000万张万张询问投票倾向的明信片,然后依据回收的询问投票倾向的明信片,然后依据回收的200万份万份结果极其自信地预测共和党候选人兰登将以领先结果极其自信地预测共和党候选人兰登将以领先15%的得票率战胜民主党候选人罗斯福而当选总统。的得票率战胜民主党候选人罗斯福而当选总统。然而,选举结果是预测者们大失所望:获胜者不是然而,选举结果是预测者们大失所望:获胜者不是兰登,而是罗斯福,并且其得票反超过兰登兰登,而是罗斯福,并且其得票反超过兰
7、登20%文摘文摘杂志的声誉一扫而光,不久就因此而关门。杂志的声誉一扫而光,不久就因此而关门。主要原因:主要原因:抽样总体不准确抽样总体不准确 不是依据美国全体已登记的选民名单,而是依不是依据美国全体已登记的选民名单,而是依据电话号码簿和汽车登记簿来编制抽样框。据电话号码簿和汽车登记簿来编制抽样框。自自1933年开始的美国经济大萧条,一方面大量人年开始的美国经济大萧条,一方面大量人口滑落到下等阶层,另一方面,此时的劳动阶层选口滑落到下等阶层,另一方面,此时的劳动阶层选民希望选个民主党人当总统,因而很多人出来投票。民希望选个民主党人当总统,因而很多人出来投票。第二节第二节 抽样的类型与抽样程序抽样
8、的类型与抽样程序一一、抽样的类型、抽样的类型抽样抽样方法方法非概率抽样非概率抽样概率抽样概率抽样偶遇偶遇抽样抽样判断抽样判断抽样配额抽样配额抽样 滚雪球抽样滚雪球抽样简单随机抽样简单随机抽样系统抽样系统抽样分层抽样分层抽样整群抽样整群抽样多段抽样多段抽样按比例按比例不按比例不按比例 概率抽样概率抽样随机抽样随机抽样 非概率抽样非概率抽样非随机抽样非随机抽样 概率抽样是按照随机原则抽取样本,排除主观因素的影响,使每一个单位都有同等的可能性被抽到。非概率抽样不遵循随机原则,是根据研究任务的要求和对调查对象的分析,主观地、有意识地在研究对象的总体中进行选择。二、二、抽样抽样的一般程序的一般程序界定总
9、体界定总体制定样本框制定样本框决定抽样方案决定抽样方案实际抽取样本实际抽取样本评估样本质量评估样本质量1 1、界定总体界定总体2 2、编制抽样框:、编制抽样框:将总体按抽样单位划分为各部分,这些部分将总体按抽样单位划分为各部分,这些部分必须互不重叠且能合成总体,然后毫无遗漏地编号排列成表必须互不重叠且能合成总体,然后毫无遗漏地编号排列成表,每个抽样单位惟一地与表上的一个号码相对应。,每个抽样单位惟一地与表上的一个号码相对应。3 3、决定抽样方案(设计、决定抽样方案(设计和抽取和抽取样本)样本):设计包括两部分,一设计包括两部分,一是确定样本容量,二是选择抽样的具体方法是确定样本容量,二是选择抽
10、样的具体方法。4 4、实际抽取样本。、实际抽取样本。5 5、评估样本与对总体进行估计评估样本与对总体进行估计。衡量样本质量主要有两个标。衡量样本质量主要有两个标准,即准确性和精确性。准,即准确性和精确性。准确性是指样本没有偏差,偏差也称系统误差,主要有准确性是指样本没有偏差,偏差也称系统误差,主要有(1 1)抽样程序的缺点,即未能严格遵循随即原则;()抽样程序的缺点,即未能严格遵循随即原则;(2 2)无)无回答,即找不到被选定的人,或者调查对象拒绝回答。回答,即找不到被选定的人,或者调查对象拒绝回答。精确性是指抽样误差的大小。精确性是指抽样误差的大小。概率抽样概率抽样就是使总体中每一个个体都有
11、一个已知就是使总体中每一个个体都有一个已知不为零的被选机会进入样本。不为零的被选机会进入样本。概率抽样分为两大概率抽样分为两大类:等概率抽样和不等概率抽样。类:等概率抽样和不等概率抽样。前者总体中每前者总体中每一个个体被选中的机会相等,后者每一个个体被一个个体被选中的机会相等,后者每一个个体被选中的机会不等,等概率抽样又称选中的机会不等,等概率抽样又称随机抽样随机抽样。随。随机样本的代表性最高机样本的代表性最高。第三节第三节 概率抽样概率抽样 简单随机抽样 系统抽样 分层抽样(适用于总体内个体数目较多,结构较复杂,内部差异较大的 情况)整群抽样(适用于对于个体单位之间界限 不清的总体)多阶段抽
12、样(适用于大规模的社会调查)仅适用于同质性较高的总体随机概率抽样的选择及方法 简单随机抽样简单随机抽样是一种特殊的等概率抽样方法是一种特殊的等概率抽样方法,严格按照随机严格按照随机原则从含有原则从含有N个单位的总体中抽取个单位的总体中抽取n个单位组成样本(个单位组成样本(Nn),),总总体体中每一个体均有同等被选机会,而且样本中每一个体是被单独中每一个体均有同等被选机会,而且样本中每一个体是被单独地选出的,它分为地选出的,它分为重复抽样和不重复抽样重复抽样和不重复抽样两类两类。操作方法:操作方法:将总体内所有个案都编上号码,然后运用随机数字表或抽签的方式获取样本。一、简单随机抽样一、简单随机抽
13、样 利用随机数表抽取样本的利用随机数表抽取样本的步骤:步骤:A A、将研究总体中的所有单位统一、将研究总体中的所有单位统一编号编号B B、根据编号位数决定随机数表中几位数字连成一组、根据编号位数决定随机数表中几位数字连成一组;C C、根据随机原则,决定随机数表中某行、某列的数字、根据随机原则,决定随机数表中某行、某列的数字为起点,然后由左至右、或由上至下、查出号码,凡为起点,然后由左至右、或由上至下、查出号码,凡总体单位编号与随机数表中数字相同者,即为选中的总体单位编号与随机数表中数字相同者,即为选中的样本号。若遇到有重复的号码,放弃不用,再查下一样本号。若遇到有重复的号码,放弃不用,再查下一
14、组号码,直到抽满样本数为止。组号码,直到抽满样本数为止。简单随机抽样简单随机抽样是概率抽样的理想类型,没有偏见,简单是概率抽样的理想类型,没有偏见,简单易行,且在从随机样本的抽取到对总体进行推断时,有一套易行,且在从随机样本的抽取到对总体进行推断时,有一套健全的规则健全的规则。l练习练习:l请利用随机数表,从请利用随机数表,从N=60总体中抽取总体中抽取15个样本。个样本。n适用范围:适用范围:q构成总体的个体差异构成总体的个体差异不大(同质性较高)不大(同质性较高)q总体中个体数较少的情况,抽取的样本容量也较小时总体中个体数较少的情况,抽取的样本容量也较小时。探究探究1 为了解某地参加计算机
15、水平测试的为了解某地参加计算机水平测试的5000名学生的成绩名学生的成绩,从中抽取从中抽取200名进行统计,名进行统计,应该运用什么方法?怎么操作?应该运用什么方法?怎么操作?分析:分析:我们按这样的方法来抽样:首先将我们按这样的方法来抽样:首先将这这5000名名学学生生从从1开始开始进行编号,然后按号码顺序以一定的间隔进进行编号,然后按号码顺序以一定的间隔进行抽取。由于行抽取。由于 ,这个,这个间隔可以定间隔可以定为为25,即即从号码从号码为为1-25的的第一个间隔中随机地抽取一个号码,第一个间隔中随机地抽取一个号码,假如抽到的假如抽到的是是6号号,然后从,然后从第第6号号开始,每开始,每隔
16、隔25个个号码号码抽取一个,得到抽取一个,得到6,6+25,6+252,6+253,6+25199这样就得到一个容量这样就得到一个容量为为200的的样本样本这种抽取方法是一种系统抽样这种抽取方法是一种系统抽样。252005000 具体做法:具体做法:1 1、将总体的所有个体前后排列、将总体的所有个体前后排列起来(起来(一般按照与研究对象性质特征无关或关系不太的任意一个中立标志进行编排,如可按姓氏笔画、时间先后、地理位置待排序。)二二、系统抽样、系统抽样又又称称机械抽机械抽样样或等距抽或等距抽样样 2、计算、计算抽样抽样间距间距K=N/n (N为总体个数,为总体个数,n为为样本个数,样本个数,抽
17、样间距为两相邻抽样单位间的距离),抽样间距为两相邻抽样单位间的距离),此时此时K为整数值为整数值。3、在第一个、在第一个K个个体中,用完全随机的方式抽取一个个个个体中,用完全随机的方式抽取一个个体,设其所在位置的序号是体,设其所在位置的序号是k 4、自、自k开始,每隔开始,每隔K个个体抽取一个个体,即陆续抽取的个个体抽取一个个体,即陆续抽取的个体所在位置序号为个体所在位置序号为k,k+K,k+2K,k+(n-1)K直到抽直到抽够够n个单位为止。个单位为止。某学校为了了解高一年级学生对教师教学的意见,某学校为了了解高一年级学生对教师教学的意见,打算从高一年级打算从高一年级503名学生中抽取名学生
18、中抽取50名进行调查名进行调查.分析:分析:为了使得每个个体被抽到的机会是匀等的,为了使得每个个体被抽到的机会是匀等的,我们先用简单的随机抽样剔除我们先用简单的随机抽样剔除3人,然后用上述系人,然后用上述系统抽样步骤进行抽样统抽样步骤进行抽样 探究探究2【解】【解】(1)先把这先把这503名学生编号名学生编号001,002,503.(2)用随机数表法任取出用随机数表法任取出3个号,从总体中剔除与这三个个号,从总体中剔除与这三个号对应的学生号对应的学生(3)把余下的把余下的500名学生重新编号名学生重新编号1,2,3,500.(4)分段取分段间隔分段取分段间隔k10,将总体均分成,将总体均分成5
19、0段每段段每段含含10名学生名学生(5)以第一段即以第一段即110号中随机抽取一个号作为起始号,号中随机抽取一个号作为起始号,如如l.(6)从后面各段中依次取出从后面各段中依次取出l10,l20,l30,l490这这49个号个号这样就抽取了一个样本容量为这样就抽取了一个样本容量为50的样本的样本例例1.从编号为从编号为150的的50枚最新研制的某种型号的导枚最新研制的某种型号的导弹中随机抽取弹中随机抽取5枚来进行发射实验,若采用每部分选枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取取的号码间隔一样的系统抽样方法,则所选取5枚导枚导弹的编号可能弹的编号可能是是A5,10
20、,15,20,25 B.3,13,23,33,43C1,2,3,4,5 D.2,4,8,16,32 练习练习(B)抽样抽样方法方法简单随简单随机抽样机抽样抽签法抽签法 系统抽样系统抽样随机数表法随机数表法共同共同点点(1)抽样过程中每个个体被抽到的概率相等;)抽样过程中每个个体被抽到的概率相等;(2)都要先编号)都要先编号各自各自特点特点从总体中逐一抽取从总体中逐一抽取先均分,再按事先确定的规先均分,再按事先确定的规则在各部分抽取则在各部分抽取相互相互联系联系在起始部分抽样时采用简单在起始部分抽样时采用简单随机抽样随机抽样适用范围总体中的个体数较少总体中的个体数较少总体中的个体数较多总体中的个
21、体数较多两种抽样方法比较两种抽样方法比较问题问题:一个单位的职工一个单位的职工500500人,其中不到人,其中不到3535岁的有岁的有125125人,人,3535到到4949岁的有岁的有280280人,人,5050岁以上的有岁以上的有9595人。为了了解这个单位职工与身体状况有关的某人。为了了解这个单位职工与身体状况有关的某项指标,要从中抽取一个容量为项指标,要从中抽取一个容量为100100的样本。由的样本。由于职工年龄与这项指标有关,试问:应用什么方于职工年龄与这项指标有关,试问:应用什么方法抽取?能在法抽取?能在500500人中任意取人中任意取100100个吗?能将个吗?能将100100个
22、份额均分到这三部分中吗?个份额均分到这三部分中吗?分析:考察对象的特点是由具有明显差异的几部分组成。分析:考察对象的特点是由具有明显差异的几部分组成。当已知总体由差异明显的几部分组成时,为了使当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几样本更充分地反映总体的情况,常将总体分成几个部分,然后个部分,然后按照按照一定一定比例比例进行抽样,这种抽样进行抽样,这种抽样叫做叫做“分层抽样分层抽样”,其中所分成的各部分叫做,其中所分成的各部分叫做“层层”。问题:问题:一一个单位的职工个单位的职工500500人,其中不到人,其中不到3535岁的有岁的有125125人,
23、人,3535到到4949岁的有岁的有280280人,人,5050岁以上的有岁以上的有9595人。为了了解这个人。为了了解这个单位职工与身体状况有关的某项指标,要从中抽取一个容单位职工与身体状况有关的某项指标,要从中抽取一个容量为量为100100的样本。由于职工年龄与这项指标有关,试问:的样本。由于职工年龄与这项指标有关,试问:应用什么方法抽取?能在应用什么方法抽取?能在500500人中任意取人中任意取100100个吗?能将个吗?能将10100 0个份额均分到这三部分中吗?个份额均分到这三部分中吗?解解:(1)确定样本容量与总体的个体数之比确定样本容量与总体的个体数之比100:500=1:5。(
展开阅读全文