《统计学基础》课件7-8章 统计抽样技术相关关系分析技术.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《《统计学基础》课件7-8章 统计抽样技术相关关系分析技术.ppt》由用户(momomo)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学基础 统计学基础课件7-8章 统计抽样技术,相关关系分析技术 统计学 基础 课件 统计 抽样 技术 相关 关系 分析
- 资源描述:
-
1、第七章第七章 统计抽样估计统计抽样估计 教学目的:教学目的:1.了解统计抽样的概念和特点;了解统计抽样的概念和特点;2.掌握抽样平均误差、抽样极限误差的计算;掌握抽样平均误差、抽样极限误差的计算;3.熟练掌握区间估计方法;熟练掌握区间估计方法;4.掌握必要样本单位数的确定方法。掌握必要样本单位数的确定方法。重点:重点:简单随机抽样组织形式的区间估计方法简单随机抽样组织形式的区间估计方法难点:难点:区别抽样误差、抽样平均误差和抽样极限误差区别抽样误差、抽样平均误差和抽样极限误差第一节第一节 统计抽样概述统计抽样概述一、统计抽样的概念一、统计抽样的概念(一)统计抽样的概念统计抽样是抽样调查和抽样推
2、断的总称,它是按照随机原则从被研究现象总体中抽取部分单位进行调查,并根据对这部分单位的调查结果对总体的数量特征作出具有一定可靠性的估计和推断,从而认识总体的一种统计方法。例如,在某地区100万户居民中,随机抽取1000户居民进行家庭收入情况调查,以此来推断该地区100万户居民的家庭收入情况,这种方式就是统计抽样。(二)抽样调查的特点(二)抽样调查的特点1.遵循随机原则从调查总体中抽取调查单位遵循随机原则从调查总体中抽取调查单位2以样本的数量特征推断总体的数量特征。以样本的数量特征推断总体的数量特征。3抽样误差可以事先计算并加以控制。抽样误差可以事先计算并加以控制。4运用了概率估计的方法运用了概
3、率估计的方法二、抽样调查的作用二、抽样调查的作用1对某些不可能进行全面调查而又需要了解全面情况的社对某些不可能进行全面调查而又需要了解全面情况的社会经济现象,可以用抽样法来了解其全面情况。会经济现象,可以用抽样法来了解其全面情况。4可用于生产过程中的质量控制。可用于生产过程中的质量控制。3可以对全面调查的资料加以补充和修订。可以对全面调查的资料加以补充和修订。2对于需要及时了解情况的现象,也经常采用抽样技术。对于需要及时了解情况的现象,也经常采用抽样技术。三、统计抽样的基本概念三、统计抽样的基本概念(一)全及总体和样本总体1全及总体,又称总体或母体,是所要认识研究对象的全体,它是由具有某种共同
4、性质的许多单位所组成的集合体。全及总体的单位数通常用N表示。如前例中,100万户居民就是全及总体,N100万。2样本总体,也称样本或子样,是指从全及总体中按照随机原则抽取的那部分个体所组成的集合体。样本总体的单位数称为样本容量,通常用n表示。(二)全及指标和样本指标1全及指标,也称总体指标或总体参数,是根据全及总体各单位标志值计算的反映总体数量特征的综合指标。常用的全及指标有总体平均数()、总体成数(P)、总体标准差()和总体方差(2)。总体中具有某一属性的单位数占总体单位数的比重,一般用P表示,即 ;总体中不具有某一属性的单位数占总体单位数的比重,一般用Q表示,即,则有 。统计中通常把这样的
5、两种比重称为成数。X1NpN0NQN1PQ(三)抽样的方法在抽样调查中,从全及总体中抽取样本单位的方法有两种:重复抽样和不重复抽样。1重复抽样,又称重置抽样或回置抽样,是指从总体中抽出一个单位后,把结果登记下来,再放回总体中参加下一次的抽选。重复抽样每次都是从全部总体单位中抽选,每个单位被抽中的机会在各次中是完全相同的,且有多次被抽中的可能。A B C D AA AB AC AD BA BB BC BD CA CB CC CD DA DB DC DDA B C D(图6-1)其样本数目用公式计算为:Nn4216(个)nNA 2、不重复抽样,考虑顺序:样本组合数目如图2:AA AB AC ADB
6、A BB BC BD CA CB CC CD DA DB DC DD A B C DA B C D(图6-2)其样本数目用公式计算为:)!(!nNN)!24(!4 12123412(个)nNB3、重复抽样,不考虑顺序,样本组合数目如图3:AA AB AC ADBA BB BC BD CA CB CC CD DA DB DC DDA B C D A B C D(图6-3)其样本数目用公式计算为:CnN+n-1 )!1(!)!1(NnnN)!14(!2)!124(10(个)4、不重复抽样,不考虑顺序:样本组合数目如图4:AA AB AC ADBA BB BC BD CA CB CC CD DA D
7、B DC DDA B C DA B C D (图6-4)其样本数目用公式计算为:)!(!nNnN)!24(!2!46(个)从以上样本数目来看,重复抽样个数大于不重复抽样个数。nND(五)抽样的组织形式1简单随机抽样简单随机抽样,又称为纯随机抽样,它是按照随机原则直接从总体N个单位中抽取n个单位组成样本,使总体中每个单位都有同等的被抽中的机会。抽签法 随机数字表法2分层抽样分层抽样,也称分类抽样或类型抽样,它是先将总体各单位按某一标志分组,然后在各组中随机抽取单位构成样本的抽样组织形式。3等距抽样等距抽样,也称机械抽样或系统抽样,它是先将总体各单位按某一标志排序,然后按相等的距离抽取单位构成样本
8、的抽样组织形式。4整群抽样整群抽样,也称成组抽样。前面介绍的三种抽样组织形式都是一个一个地抽取样本单位,故也称为个体抽样。第二节第二节 抽样误差抽样误差一、抽样误差的概念一、抽样误差的概念 要了解抽样的概念,必须正确认识误差的不同类型,准确地把握抽样误差的概念。1、计量误差;2、记录误差;3、计算误差;4、抄录误差;5、汇总误差;6、调查者、被调查者有意虚报或瞒报造成的误差。1、偏差:破坏了随机原则产生的偏差(系统性误差)(1)实际误差(绝对误差)|X x|Pp|(2)抽样平均误差 x,p 2、抽样随机 性误差 登记误差 抽样代表性 统计误差 (图6-5),二、影响抽样误差大小的因素二、影响抽
9、样误差大小的因素 抽样误差的大小受以下几个因素的影响:1样本单位数(样本容量n)的多少。2总体各单位标志值的变异程度。3抽样方法。4抽样组织形式。三、抽样平均误差三、抽样平均误差从一个总体中可以抽取许多个样本,每个样本指标与总体指标之间的离差称为抽样实际误差。但是在实践中总体指标数值往往是未知的,因此抽样实际误差是无法计算的。在实际工作中是以抽样平均误差来衡量抽样误差大小的 2()xxXMMPpp2)()(2312276件nxxx Txxi2)(1220 667.11.291.29(件)(件)从这里我们可以看出,复重抽样的抽样平均误差大从这里我们可以看出,复重抽样的抽样平均误差大于不重复抽样的
10、抽样平均误差。于不重复抽样的抽样平均误差。用定义公式计算抽样平均误差很麻烦,在实际工作中用定义公式计算抽样平均误差很麻烦,在实际工作中,也是难以做到的。能不能将定义公式转换成适用公式,也是难以做到的。能不能将定义公式转换成适用公式?数理统计研究证明,是可以的。因为:抽样平均误差?数理统计研究证明,是可以的。因为:抽样平均误差就是所有可能出现的样本指标和总体指标的平均离差,就是所有可能出现的样本指标和总体指标的平均离差,所有可能的抽样平均数的平均数,就是总体平均数的数所有可能的抽样平均数的平均数,就是总体平均数的数学期望学期望 ,即:,即:)(xEx=nxx2)(nXEx2)(两边平方得:2xE
11、(ix X)2 E nxxxn.21 nXn 2 E nXxXxXxn)(.)()(212 )(2)(.)()(1222212XxXxEXxEXxEXxEnjijin 由于)(xxi0 ,E)(xxi2 2,则上式:nnnnn222222212).(1两边开方:,nnx2这是重复抽样的抽样平均误差公式。对于不重复抽样,则要在根号内加乘修正系数:)1(2NnNnx,当N100时,1可忽略不计,则变成:=)1(2Nnn在小样本条件(小于30)下,仍用系数)1(NnN。未知的情况下,也可以用S代替,计算 在 x 结合6.1例,重复抽样条件下:首先,我们计算总体标准差:见表6-3:60000N 300
12、n 300698%300p【例例7-37-3】一批罐头共一批罐头共6000060000桶,随机抽查桶,随机抽查300300桶,发现有桶,发现有6 6桶不合格,求合格率的抽桶不合格,求合格率的抽样平均误差。样平均误差。已知:已知:p(1)PPn98%2%0.808%300p(1)98%2%300(1)(1)0.806%30060000pPPnunN在重复抽样条件下,在重复抽样条件下,在不重复抽样条件下,在不重复抽样条件下,p四、抽样极限误差四、抽样极限误差xxX ppP xxt 概率与概率度如图概率与概率度如图6-5 6-5 表表6-56-5:(图6-6)【例7-4】已知某乡粮食亩产量的标准差为
13、公斤,总体单位数为亩,现重复随机抽取400亩进行调查,求得其抽样平均误差为查 正态分布概率表,当t=2时,置信度F(t)为95.45%。804400 xn824xxt第三节第三节 总体指标推断总体指标推断一、点估计一、点估计点估计,也称定值估计,它是直接以样本指标的实际值作为相应总体指标的估计值。用公式表示为:xXPp 二、区间估计二、区间估计PpXxpxppxXpPpxXx【例7-6】某地区种植小麦4000亩,重复随机抽取200亩进行试验,测得结果:平均亩产量300千克,抽样总体的标准差为6千克,试求在概率为95.45%的保证下,小麦的平均亩产量的可能范围是多少?所以,小麦平均亩产量的可能范
14、围是3000.84,即299.16300.84千克。60.42200 xsn()95.45%F t 2 0.420.84xxt 2()xxf按重量分组按重量分组/克克/包包包数包数/包包xxf6668687070727274747626642676971737513441442629215028.8819.440.2419.3635.28合计合计20-1416103.20试以试以95.45%的概率保证程度推算:的概率保证程度推算:这批食品的平均每包重量是否符合规定要求;这批食品的平均每包重量是否符合规定要求;若每包食品重量低于若每包食品重量低于70克为不合格,求合格率的范围。克为不合格,求合格
展开阅读全文