抽样与抽样分布课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《抽样与抽样分布课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样 分布 课件
- 资源描述:
-
1、2022-8-3统计学院统计学院1STAT本章重点本章重点:1.1.简单随机抽样;简单随机抽样;2.2.的抽样分布;的抽样分布;3.3.的抽样分布;的抽样分布;4.4.其他组织形式的抽样;其他组织形式的抽样;本章难点本章难点:抽样分布原理。抽样分布原理。xp2022-8-3统计学院统计学院2统计实例(统计实例(Statistics in Practice)我国某家用电器公司是国内空调最大的生产厂家之一,我国某家用电器公司是国内空调最大的生产厂家之一,2004年时其空调年销售就年时其空调年销售就已达到已达到700万台,销售额为万台,销售额为120亿元。这家低亿元。这家低调、在外界看来有些神秘的家
2、电企业,尽管不作声张,极少炒作调、在外界看来有些神秘的家电企业,尽管不作声张,极少炒作,甚至喊出,甚至喊出“不想做行业老大不想做行业老大”的话,之后的话,之后3年来却成长势头迅年来却成长势头迅猛,增长率一直猛,增长率一直40%以上,赢利率极高。为了避免当今家用电器以上,赢利率极高。为了避免当今家用电器行业低价利薄的局面,实现多条腿走路,以在新一轮竞争中保持行业低价利薄的局面,实现多条腿走路,以在新一轮竞争中保持优势,该电器集团决策人又提出了进军汽车行业的战略目标。为优势,该电器集团决策人又提出了进军汽车行业的战略目标。为此他要求公司营销部对国际国内各大汽车生产厂家生产能力、销此他要求公司营销部
3、对国际国内各大汽车生产厂家生产能力、销售额、营利能力、市场占有率等方面作调查分析。售额、营利能力、市场占有率等方面作调查分析。作为公司营销部负责人来说,他必须思考怎样去采集汽车生作为公司营销部负责人来说,他必须思考怎样去采集汽车生产厂家的这些经济机密数据?获得这些数据后,应采用什么方法产厂家的这些经济机密数据?获得这些数据后,应采用什么方法作数据分析与推断。这必然会用到统计推断的知识。作数据分析与推断。这必然会用到统计推断的知识。2022-8-3统计学院统计学院3 从这一章开始便进入推断统计学的学习内容,它会节省人从这一章开始便进入推断统计学的学习内容,它会节省人们的时间和财物来达到认识对象的
4、最佳限度。们的时间和财物来达到认识对象的最佳限度。现实世界包含的素材集合非常庞大,从中提取需要的信息现实世界包含的素材集合非常庞大,从中提取需要的信息非常困难。如:非常困难。如:选民人数:每个候选人的支持率是多少?选民人数:每个候选人的支持率是多少?产品:不合格率是多少?产品:不合格率是多少?环境:污染程度如何?环境:污染程度如何?市场:品种、价格、质量状况、购买力等情况的了解。市场:品种、价格、质量状况、购买力等情况的了解。在这一章里,你将会了解到样本是怎样抽取的,样本统计在这一章里,你将会了解到样本是怎样抽取的,样本统计量是怎样分布的,如何根据样本统计量对总体参数做估计。量是怎样分布的,如
5、何根据样本统计量对总体参数做估计。2022-8-3统计学院统计学院4STAT例例 某养猪场共有存栏肉猪某养猪场共有存栏肉猪10000头,现欲了解这批肉猪平头,现欲了解这批肉猪平均每头毛重,如果将每头肉猪都过秤去秤而获取数据将是均每头毛重,如果将每头肉猪都过秤去秤而获取数据将是不合算的。我们可以按照不合算的。我们可以按照“等机会原则等机会原则”从中抽出从中抽出100头头肉猪称其重量,计算这肉猪称其重量,计算这100头猪的平均每头毛重,以达到我头猪的平均每头毛重,以达到我们期望的目的。们期望的目的。本例中存栏肉猪本例中存栏肉猪1000010000头组成的总体,则称为头组成的总体,则称为全及总体全及
6、总体,它,它是指在统计抽样中所要了解的研究对象整体,又称为母体是指在统计抽样中所要了解的研究对象整体,又称为母体,当我确定了研究目标时,它具有惟一性。一般全及总体,当我确定了研究目标时,它具有惟一性。一般全及总体的单位总数用的单位总数用N N表示,称作表示,称作总体容量总体容量。2022-8-3统计学院统计学院5STAT本例中所抽出的本例中所抽出的100100头肉猪组成的总体,则称为头肉猪组成的总体,则称为样本总体样本总体,它是,它是指在统计抽样中按照指在统计抽样中按照“等机会原则等机会原则”从从全及总体全及总体的的N(10000)N(10000)中中抽出的部分单位抽出的部分单位(每个单位称作
7、样本单位每个单位称作样本单位)所组成的整体,简称样所组成的整体,简称样本,又称子样。一般样本总体的单位总数用本,又称子样。一般样本总体的单位总数用n(100)n(100)表示,称作样表示,称作样本容量。样本总体则不具惟一性,它的可能个数与本容量。样本总体则不具惟一性,它的可能个数与N N、n n及抽样方及抽样方法有关。通常法有关。通常n30n30,则不论是否已知总体分布状态,样本平均数,则不论是否已知总体分布状态,样本平均数的分布趋近正态分布,而且其分布比总体分布更集中,即的分布趋近正态分布,而且其分布比总体分布更集中,即 nx22其中其中 为样本平均数的方差,为样本平均数的方差,为总体方差为
8、总体方差2x2定理:设定理:设X是具有期望值为是具有期望值为 ,方差为,方差为 的任意总体,则的任意总体,则样本平均数的抽样分布,将随着样本平均数的抽样分布,将随着n的增大而趋于正态分布,分的增大而趋于正态分布,分布形式(参数)为布形式(参数)为 N()-中心极限定理中心极限定理n2,2x2022-8-3统计学院统计学院49身高身高 cmcm人数人数频率频率1401401501501501501601601601601701701701701801801801801901905 52020505020205 50.0.05050.0.20200.0.5 50.0.20200.050.05合计合
9、计1001001.001.00=165cm,=8.94cmP150 X 180=0.90140 150 160 170 180 1900.50.40.30.20.1身高身高(以已知总体为例以已知总体为例)2022-8-3统计学院统计学院50调整:调整:“频率密度频率密度”(频率(频率/组距)组距)“频率频率”;直方或直方或 折线覆盖下的面积折线覆盖下的面积=1 1身高身高 cmcm频率频率频密频密1401401501501501501601601601601701701701701801801801801901900.0.05050.0.20200.0.5 50.0.20200.050.050
10、.0050.0050.0200.0200.050.050.0200.0200.0050.005合计合计1 1.00000.10.1=165cm,=8.94cm140 150 160 170 180 190身高身高2022-8-3统计学院统计学院51当组数当组数n无穷大,折线无穷大,折线曲线。曲线。190.0)(180150180150dxxfXP身高身高140 150 160 170 180 1900.050.040.030.020.01190.0P),(2NX22)(2121)(xexf=165cm,=8.94cm身高身高 cmcm频率频率频密频密1401401501501501501601
11、601601601701701701701801801801801901900.0.05050.0.20200.0.5 50.0.20200.050.050.0050.0050.0200.0200.050.050.0200.0200.0050.005合计合计1 1.00000.10.12022-8-3统计学院统计学院52 注:参数注:参数、不同不同分布的形状与位置不同。分布的形状与位置不同。),(211NX),(222NX),(233NX22)(2121)(xexf标准化办法 1)(2121XXdxxfXXXP概率计算的困难2022-8-3统计学院统计学院53xZ标准化1)0(0)(2NZZD
12、NZZE x1 x2-Z 0 Z),(2NX)1,0(:NZ标准正态分布XZ容易证明得到容易证明得到2022-8-3统计学院统计学院54162 170 178-z/2 0 z/2)8,170(2NX)1,0(NZXZ15531802?1781621)8,170(1002x)P(x)P(x)P(。NX人的身高例81701788170162178162xPxP%27.6812/ZZP122xZ变量1112/2/ZZZP2022-8-3统计学院统计学院55 第四节第四节 的抽样分布的抽样分布 样本比例样本比例 的所有可能取值的概率分布的所有可能取值的概率分布p一、一、的期望值和标准差的期望值和标准差
13、pp PpEP-总体比例总体比例p计算式如下:计算式如下:有限总体有限总体无限总体无限总体11NnNnPPpnPPp1根据中心极限定理,当样本容量根据中心极限定理,当样本容量n很大时,可视很大时,可视 的分布为正态的分布为正态分布。条件:分布。条件:515pnnpp2022-8-3统计学院统计学院56STAT 注:注:(1)可用样本成数方差代替总体成数方差;)可用样本成数方差代替总体成数方差;(2)可用样本成数)可用样本成数 代替总体成数代替总体成数P;(3)有若干个)有若干个P值时,值时,P取最接近取最接近0.5的的P值;值;(4)无)无P值时,取值时,取P=0.5 (此时方差最大此时方差最
14、大)2022-8-3统计学院统计学院57STAT 例:一批食品罐头60,000桶,随机抽查300桶,发现有6桶不合格,求合格率的抽样平均误差。解:已知样本的合格率=重复抽样:不重复抽样:98.03006300%808.000808.0300)98.01(98.0)1(nPPp%806.0)000,603001(30002.098.0)1()1(NnnPPp2022-8-3统计学院统计学院58 第五节第五节 其他抽样组织形式其他抽样组织形式 抽样组织形式是指在抽样时对总体的加工整理形抽样组织形式是指在抽样时对总体的加工整理形式。根据对总体的加工整理形式不同,在抽样调查中式。根据对总体的加工整理形
15、式不同,在抽样调查中抽样的组织方式很多,除简单随机抽样外,还有类型抽样的组织方式很多,除简单随机抽样外,还有类型抽样、等距抽样、整群抽样、多阶段抽样等其他抽样抽样、等距抽样、整群抽样、多阶段抽样等其他抽样组织形式。组织形式。2022-8-3统计学院统计学院59STAT一、类型(分层)抽样一、类型(分层)抽样1.概念 先将全部总体单位按主要标志进行分组(类),再按随机原则在各组进行纯随机抽样。2.抽样数目在各组的确定(1)类型平均抽样 适用前提是各组单位数相等或差异不大的情况下。(2)不等比例抽样:i/=ni/n 离差越大,抽得越多,反之亦反。niiini2022-8-3统计学院统计学院60ST
展开阅读全文