统计学-数据的收集课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《统计学-数据的收集课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 数据 收集 课件
- 资源描述:
-
1、统计学StatisticsStatistics第第 2 2 章章 数据的收集数据的收集u 2.1 2.1 数据收集的主要方法数据收集的主要方法u 2.2 2.2 几种基本的抽样方法几种基本的抽样方法u 2.3 2.3 数据收集的误差数据收集的误差u 2.4 2.4 小结小结第第 2 2 章章 数据的收集数据的收集2.1 2.1 数据收集的主要方法数据收集的主要方法数据收集的主要方法数据收集的主要方法根据研究的目的和要求,采用科学的方法,有组织、有计划地收集数据信息资料的过程,称之为统计调查统计调查(statistical survey)。实践中,数据来源通常有两个主要渠道:一是直接进行调查或实
2、验,获得“一手数据”;二是通过他人调查或实验的结果整理得到“二手数据”。数据收集的主要方法数据收集的主要方法在社会经济领域,专门调查是直接获取数据的重要手段,包括了一国政府组织的各种普查、抽样调查、统计报表制度等,也包括了企业、机构、部门甚至个人为了特定目的而进行的各种市场调查、产品测试、民意调研等。调查数据一般是客观上已经存在的,但需要通过观察或询问的方式才能收集汇总得到。显然,调查数据大多与时间有关,是特定时期或时点上的变量结果,因此,这类数据也会随着时间的变化而改变,理论上无法重复观察。数据收集的主要方法数据收集的主要方法此外,调查的对象通常以人为主体,即使调查对象是其他的客观事物(如一
3、块土地),调查的结果(如产量)也往往与人的活动有关。这就使得要收集高质量的调查数据,必须将人为因素的干扰尽可能控制在最低限度,而这也恰恰是收集调查数据的难点所在。科学实验则是收集自然科学数据的常用手段。与调查数据不同,实验数据是在控制一个或多个因素的前提下,观察感兴趣的变量结果,实验的次数也可以是无限的,并且可以通过改变控制因素,观察变量结果的变化情况。数据收集的主要方法数据收集的主要方法相较于专门调查,通过科学实验收集数据在一定程度上能更为有效地控制数据质量,但也更加专业,受到的技术甚至法律、道德等因素的制约更多,从而应用的领域不及专门调查广泛。值得一提的是,随着计算机技术和电子商务的快速发
4、展,很多数据被自动收集保存到特定的数据库当中,成为当今“大数据”的主要来源。如果能够根据研究目的,“量身定制”调查或实验方案,直接收集“一手数据”,当然是最好的。但对于大多数使用者来说,受各方面因素的限制,设计、实施一项调查或实验往往是不太现实的,能够获得的数据量也较为有限。因此,人们更多的是通过收集整理他人调查或实验的结果来间接获取“二手数据”。数据收集的主要方法数据收集的主要方法政府、企业、机构等公开出版或发布的数据,各类媒体公开报道的数据,都是十分重要的间接数据来源。对于使用者来说,“二手数据”的收集显然更加快捷、经济而便利,并且能够突破直接数据收集在时间上的约束,观察变量在较长一段时期
5、内的变化趋势。但是,需要注意的是,由于“二手数据”是他人调查或实验的结果,并非根据使用者自身的研究目的设计、实施的,很难完全吻合使用者的研究需要,因此,对于数据的筛选、检查、核实等预处理工作就显得尤为重要,避免误用或滥用。第第 2 2 章章 数据的收集数据的收集2.2 2.2 几种基本的抽样方法几种基本的抽样方法几种基本的抽样方法几种基本的抽样方法如果在抽样的过程中,总体中的每个个体都有一个已知的机会(概率)被选中,那么依据这样的抽样方案得到的样本就是一个随机样本随机样本(random sample)。按照一定的概率,依据随机原则从总体中抽取部分单元的抽样方法就称为随机抽样随机抽样(rando
6、m sampling)或概率抽样概率抽样(probability sampling)。随机抽样最主要的优点是,由于每个总体单元都是随机抽取的,而且能够计算出每个单元被抽中的概率,因此能够计算出数据收集过程中的抽样误差,从而得到样本估计结果的可靠程度。几种基本的抽样方法几种基本的抽样方法假设总体一共有N个单元,从中随机地抽取n个单元组成最后的样本,并且总体中每个单元被抽中的概率是相等的,这就是简单随机抽样简单随机抽样(simple random sampling)。采用简单随机抽样时,如果每抽取一个单元记录下数据后,再把这个单元放回到原来的总体中参与下一次的抽选,称为有放回抽样有放回抽样或重复重
7、复抽样抽样(sampling with replacement)。如果被抽中的单元不再放回到总体中,每次抽样都仅从剩余的单元中随机抽取,就称为无放回抽样无放回抽样或不重复抽样不重复抽样(sampling without replacement)。几种基本的抽样方法几种基本的抽样方法简单随机抽样是一种最基本的概率抽样方法,也是其他抽样方法的基础。这种方法简单直观,尤其在计算机技术发达的今天,可以方便地利用计算机从总体中抽取简单随机样本。但是,简单随机抽样在实际应用时也存在一些局限性。首先,要获得包含总体所有单元的名单可能是不现实的;其次,如果总体单元某方面的特征(如性别)有可能对研究变量(如身高
8、)产生影响,抽样时就需要借助这些辅助信息合理安排样本构成比例,提高估计的效率。因此,根据研究问题和研究对象的不同,人们往往会将简单随机抽样与其他抽样方法结合起来使用。几种基本的抽样方法几种基本的抽样方法分层抽样分层抽样(stratified sampling)是在抽样之前先将总体单元按照某种特征或某种规则划分成不同的层,然后从不同的层中独立、随机地抽取一定数量的单元组成样本。分层抽样可以借助总体单元的某些辅助信息,确保不同特征的总体单元都能以一定的数量被包含到样本中,避免了一次简单随机抽样可能抽中的具有相同特征的总体单元过于集中的偏差,使样本结构在一定程度上更加接近总体结构,提高估计的精度。此
9、外,由于分层抽样不仅可以收集样本数据估计总体的目标变量,还可以提供不同层的估计结果,因此便于比较不同特征的总体单元之间的差异。几种基本的抽样方法几种基本的抽样方法整群抽样整群抽样(cluster sampling)是在抽样之前先按照某种规则将总体单元划分为不同的群,然后随机抽取部分群,被抽中的群中所有的单元都入选到样本中,没有被抽中的群则不做调查。整群抽样与分层抽样看似相近的地方是,在抽样之前都会按照某种规则将总体单元进行分类,但其实质作用则不尽相同。几种基本的抽样方法几种基本的抽样方法分层抽样中对总体单元的分层,目的是为了保障每个层内都有一定数量的单元被抽中,其假设前提是不同层的总体单元之间
展开阅读全文