书签 分享 收藏 举报 版权申诉 / 68
上传文档赚钱

类型《抽样与抽样分布》课件.ppt

  • 上传人(卖家):晟晟文业
  • 文档编号:4784351
  • 上传时间:2023-01-10
  • 格式:PPT
  • 页数:68
  • 大小:8.69MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《《抽样与抽样分布》课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    抽样与抽样分布 抽样 分布 课件
    资源描述:

    1、4 统计抽样与抽样分布统计抽样与抽样分布u 抽样的基本概念u 抽样方法与误差u 抽样分布的概念u 样本均值的抽样分布u 样本比率的抽样分布本章的学习目的本章的学习目的u本章的学习目的是为了认识到通过样本推断总体的科学性。u当总体元素非常多,或者检查具有破坏性时,需要进行抽样抽样。u抽样必定伴有某种程度的不确定性,需要用概率来表示其可靠程度,这是推断统计的重要特点。案例案例u1936年美国总统选举的预测,民主党罗斯福VS共和党兰登。文摘邮寄了1000万份调查表;收回240万万份,预测兰登获得57%的选票获胜。而盖洛普(Gallup)研究所仅仅随机抽取了2000 多选民,预测罗斯福将得到54%的选

    2、票获胜。u选举结果是罗斯福获得62%的选票获胜。u此后,盖洛普研究所每年用10001500人的样本快速准确的预测选举,误差在2%之内之内。案例案例u盖洛普公司的网站u盖洛普民意调查举例:抽样的基本概念抽样的基本概念u抽样调查抽样调查,按照随机原则从全部研究对象中抽取一部分单位进行调查,并以调查结果对总体数量特征作出具有一定可靠程度的估计与推断,从而认识总体的一种统计方法。u随机原则随机原则:指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会。抽样的基本概念抽样的基本概念u总体总体,要研究的调查对象的全体。u个体个体,组成总体的每个元素。u样本样本:从总体中随机

    3、抽取的部分个体。u样本容量样本容量:样本中所含的个体数量。样本和总体(样本和总体(sample&population)u视频教学应该随机吗?应该随机吗?u随机选择并非永远都是好主意,有时候我们无法对所有的人一视同仁,因为有的人或许更有资格。1.篮球比赛有400个座位,但有700个学生想要票,是否应该在学生中随机选取400人?2.等着换肝脏的病人,人数远超能用于移植的肝脏数目。在选择移植给谁时,应该完全用随机方式吗?3.越战期间,用抽签的随机方式,决定年轻男子谁上战场,这是最好的方式吗?观测研究和实验的区别观测研究和实验的区别u观测研究,在只观测不干扰的情形下搜集信息。u实验:会对个体做某件事情

    4、,然后观察个体如何反应。u例:经常运动是否可以降低心脏病发作的风险?(观测研究和实验有什么不同,各自的优点)观测研究和实验的区别观测研究和实验的区别方法1:一位研究者找到2000名40岁以上的男士,他们都经常运动,也未曾发过心脏病,他为每个人“配”了一名各方面条件接近,但没有固定运动习惯的人,然后观察运动组和非运动组长达5年时间。方法2:另一位研究者找了4000名40岁以上的男士,他们都没有发作过心脏病,也愿意参加这项研究。他安排其中的2000人参加了一项有监督的定时运动计划,另外2000人依照原来的习惯不变,观察5年时间。(对于规律运动是否降低心脏病风险的问题,实验可以提供更多有用的信息)两

    5、种两种有偏有偏的抽样方法的抽样方法u方便抽样,在总体中选择最容易取得的个体。例如,从每箱桔子中拿上面的几个检查,但它们可能无法代表整箱桔子的情况。u自发性回应样本:是经由对某一诉求的回应而自然形成的,会导致高度偏差。两种有偏的抽样方法两种有偏的抽样方法u自发性回应样本:例如,专栏作家Landers问读者:“如果可以重来一次,你还会要孩子吗?”她接到1万份答复,其中70%说不要。难道70%的父母都后悔了吗?u通常对某个论题有强烈感觉的人,尤其是负面感觉,比较会不嫌麻烦地去回应。u写信回应和电话回应,一定会导致高度偏差。随机原则的实现随机原则的实现u抽签法抽签法,是将总体中每个单位的编号写在外形完

    6、全一致的签上,将其搅拌均匀,从中任意抽选,签上的号码所对应的单位就是样本单位。u随机数表法随机数表法:将总体中每个单位编上号码,然后使用随机数表,查出所要抽取的调查单位。u计算机模拟法计算机模拟法:是将随机数字编制为程序存储在计算机中,需要时将总体中各单位编上号码,启用随机数字发生器输出随机数字。简单随机抽样简单随机抽样u大小为n的简单随机样本(SRS,simple random sample):使得总体中任一组n个个体,中选的概率相同。u随机原则:用机遇选择样本。1.对每个个体指定一个数字代码;2.用随机数表选取。随机数表(部分)用Excel表生成随机数你玩乐透吗?你玩乐透吗?u盖洛普研究所

    7、曾抽取了一个1523人的样本,其中有868人在过去的12月中买了乐透,对于这个样本的比率:u如果取1000个样本呢?p=8681523=0.57 57%()大样本的变异性比小样本小大样本的变异性比小样本小估计时的两种误差估计时的两种误差u偏差:统计量一直朝一个方向偏离总体的参数值;(瞄准有问题)u变异性:取很多样本时,统计量的值会离散到什么程度。如果变异性大,说明不同样本的结果可能差别很大。(技术不稳定)u一个好的抽样方法,应该要有小偏差、小变异性。(象神射手一样)两种误差两种误差如何处理误差如何处理误差u减低偏差:利用随机抽样,用SRS的统计量来估计总体参数。u降低SRS的变异性:只要样本足

    8、够大。误差界限误差界限u一个随机样本的结果,不会刚好估计出总体的真正值。所以,用误差界限,表达我们的估计值距离真正值有多远。u95%的置信度:所有样本中,有95%计算出的统计量距离真正值的确有那么近,但是另外的5%,距离真正值就超过误差界限了。误差界限速算法误差界限速算法u用大小为n的随机样本,对应95%置信度的误差界限,大致为 。u盖洛普调查的1523人,对应的误差界限为盖洛普当时公布的误差界限是3%对于100人的样本的误差界限是多大?1n11523=139.03=2.6%置信叙述置信叙述u盖洛普对于乐透彩票购买情况所做的结论:u精简版:调查发现57%的美国成年人在过去12个月中曾购买彩票。

    9、我们有95%的信心,所有美国成年人购买彩票的真正比例,在这个样本结果的正负3个百分点之内。u超精简版:我们有95%的信心,所有美国成年人中,有54%-60%曾在过去12个月里买过彩票。抽样的误差问题抽样的误差问题u抽样误差抽样误差:用于抽样的随机性所带来的误差,是一种固有误差。u非抽样误差非抽样误差:调查过程中发生的误差,以及由于主观因素破坏了随机性原则而产生的系统性偏差,是可以避免的。抽样误差抽样误差167CM 169CM 172CM 160CM 162CM 167CM 175CM 180CM 165CM 167CM170CM 175CM 178CM 180CM 162CM 173CM 15

    10、5CM 160CM 170CM 165CM平均身高平均身高=169.8CM平均身高平均身高=174.6CM总平均身高总平均身高=168.6CM随机抽样设计随机抽样设计u不同的抽样方式,对抽样结果有很大影响,根据研究目的和要求,以及具体情况选择抽样方式;u简单随机抽样、等距抽样、类型抽样、整群抽样、多阶段抽样等。u即便是最好的统计学家,也做不到最正确的抽样方法。分层抽样的问题分层抽样的问题u一所大学中有30000个学生,其中3000个是研究生。如果要抽取一个500名学生的SRS,每个学生被抽中的概率是相同的(1/60)。如果预期在SRS中有10%研究生,只有50人,样本不够大,无法精确估计研究生

    11、的意见。所以,用包含200研究生,300大学生的分层样本比较好。u那么,如何来选取这个分层的SRS?抽样分布抽样分布u在讨论抽样分布之前,需要回顾以下一些与概率分布有关的概念:u随机变量、离散型随机变量离散型随机变量及其概率分布、连续型随机变量连续型随机变量及其概率分布。u概率密度函数。随机变量(随机变量(Random Variable)u随机变量随机变量是表征一个随机试验结果的变量,其数值由一次试验结果所决定,但是在试验之前是不确定的。u随机变量的所有可能取值就是所有基本事件对应的值。通常用英文大写字母或希腊字母表示。u离散型、非离散型、连续型。随机变量(随机变量(Random Variab

    12、le)u离散型随机变量:投掷骰子;u非离散型随机变量:某路口24小时内经过的车辆;u连续型随机变量:灯泡寿命。离散型随机变量离散型随机变量u离散型随机变量离散型随机变量的取值域由有限个或可数多个数值或符号组成。u其概率是指离散型随机变量(X)取一个具体数值(x)的概率,即P(X=x)。u离散型随机变量的概率分布是指离散型随机变量取遍每一个实验结果x的概率的分布情况,常用列表表示,如下表。离散型随机变量离散型随机变量X的取值的取值x123456X的概率的概率 P(X=x)1/6 1/6 1/6 1/6 1/6 1/6连续型随机变量连续型随机变量u连续型随机变量连续型随机变量的取值域为一个连续区间

    13、。u只有在(连续的)区间上取值时,其概率才可能为正值,连续型随机变量在任何一点上的概率都为零。1)(021xXxP)(21xx 0)()(21=xXPxXP概率密度函数概率密度函数u连续型随机变量的概率密度函数概率密度函数 f(x)=xduufxXPxF)()()()()(xFxf=u概率密度函数的含义:曲线 f(x)下任何一个区间的面积,等于随机变量 X 在该区间取值的概率。最常见的连续型随机变量的概率分布最常见的连续型随机变量的概率分布u正态分布正态分布(P40)。若随机变量若随机变量 x 的概率密度函数的概率密度函数,21)(222)(=xexfx),(2NX记为记为 最常见的连续型随机

    14、变量的概率分布最常见的连续型随机变量的概率分布标准正态分布标准正态分布:1,02=标准正态分布标准正态分布=XZZ 分数标准正态分布的计算标准正态分布的计算u u u)(1)(zz=)()()(abbZaP=1)(2)(=aaZu u u 95.0)96.1(=Z99.0)58.2(=Z90.0)645.1(=Z例例:设随机变量设随机变量X N(0,1),求下列概率:,求下列概率:(1)P(X1);(4)P(-1.80X2.45)(1)查正态分布数值表查正态分布数值表,当当x=0时时,对应的对应的(x)=0.5(2)查正态分布数值表,当查正态分布数值表,当x=2.77时,对应的时,对应的(x)

    15、=0.9972,所以所以P(X1)=1-P(X 1)=1-(1)查正态分布数值表,查正态分布数值表,(1)=0.8413所以所以 P(X1)=1-(1)=0.1587例例:设随机变量设随机变量X N(0,1),求下列概率:,求下列概率:(1)P(X1);(4)P(-1.80X2.45)(4)因为因为P(-1.80X2.45)=(2.45)-(-1.80)=(2.45)-1-(1.80)查正态分布数值表查正态分布数值表,(2.45)=0.9929,(1.80)=0.9641,所以所以 P(-1.80X2.45)=0.9929-1-0.9641=0.9570正态分布的计算正态分布的计算 例题例题u

    16、某厂生产的某种节能灯管使用寿命服从正态分布,对某批次产品的测试结果,平均使用寿命为1050小时,标准差为200小时。求:1.使用寿命在500小时以下的灯管占多大比例?2.使用寿命在8501450小时的灯管所占比例?3.以均值为中心,95%的灯管使用寿命的范围?68.27%95.45%99.73%),(2nNx2323n 视频:视频:经验法则经验法则,经验法则的另一个例题经验法则的另一个例题正态分布的练习(正态分布的练习(Z分数)分数)(1)把两个人的分数表示成Z分数,可以看出两位女士在 各自的年龄组中居于什么位置。(2)相对于自己的年龄组,莎拉和母亲谁的IQ高?相对于测量值,莎拉和母亲谁的IQ

    17、高?=XZ关于智商的问题u斯坦福-比奈(Stanford-Binet)智力量表:1986年公布第四次修订版。量表共包含15个分测验,可以评定4个认知领域,即言语推理、抽象/视觉推理、数量推理和短时记忆。网页链接u韦氏(Wechsler)智力量表:医院使用。u门萨智力测试:适用于高智商和高学历人群。百度百科链接什么是抽样分布?什么是抽样分布?u如果要估计总体的均值 ;是用样本平均值 ,还是用中位数 m?u还是掷骰子,总体均值第一次,2,2,6,m=2,第二次,3,4,6,m=4,u可见,不能仅仅根据一个样本去比较是 和 mu样本统计量本身是随机变量,抽样分布抽样分布就是由样本n个观察值计算的统计

    18、量的概率分布。x5.3=33.3=x33.4=xx样本均值的抽样分布样本均值的抽样分布 u一个总体1,2,3,4.重复抽样方法,先抽一个,放回,再抽一个。u样本均值 的抽样分布x样本均值的抽样分布样本均值的抽样分布 u有放回(with replacement)抽样 123411,112,11.53,124,12.521,21.52,223,22.54,2 331,322,32.53,3 34,3 3.541,42.52,433,43.54,44样本均值的抽样分布样本均值的抽样分布 的取值 的个数概率1.011/161.522/162.033/162.544/163.033/163.522/16

    19、4.011/16xx中心极限定理中心极限定理u中心极限定理中心极限定理:不论该总体服从何种分布,只要当样本容量足够大(),样本均值的分布都近似服从正态分布。30n),(2nNX程序模拟程序模拟u 视频:程序模拟n的不断增加样本均值的抽样分布与总体的关系样本均值的抽样分布与总体的关系总体分布总体分布正态分布正态分布非正态分布非正态分布大样本大样本小样本小样本正态分布正态分布大样本大样本小样本小样本正态分布正态分布t 分布分布x 的抽样分布例题的抽样分布例题 1u某汽车电池的制造商声称其最好的电池寿命的均值是54个月,标准差为6个月。某消费组织决定购买50个该品种电池作为样本来检验电池寿命,1.假

    20、设该制造商所言为真实的,请描述这50个电池样本的平均寿命的抽样分布;2.假设该制造商所言是真实的,则消费组织的样本寿命小于或等于52个月的概率是多少?x 抽样分布例题抽样分布例题 11.运用中心极限定理推断:对于50个电池的样本来说,平均寿命的分布近似正态分布平均寿命的分布近似正态分布。因此,这个抽样分布的均值与抽样总体的均值是相同的,抽样分布的标准差由公式计算,得 个月;个月 54=85.0506=nxx 抽样分布例题抽样分布例题 12.假设制造商所言是真实的,则对于50个电池的样本来说,消费组织观察到电池的平均寿命小于或者等于52个月的概率 ,等于下图的阴影面积,计算标准正态分布 z 值求

    21、这个面积:)52(xP0094.09906.01)35.2(1)52(35.285.05452=xPxzxxx 抽样分布例题抽样分布例题 1 因此,假设制造商的声明是真实的,则消费组织观察到的样本均值(即电池平均寿命)小于或者等于52个月的概率仅为 0.0094 这么小的概率几乎是不可能发生的!这么小的概率几乎是不可能发生的!那么,如果50 个电池的平均寿命小于52个月,则说明该制造商所言是不真实的。x 抽样分布例题抽样分布例题 2u某酒店电梯标志注明最大载重为18人,1350 kg。假定已知该酒店游客及其携带行李的平均重量为70 kg,标准差是6 kg。试问,随机进入电梯18人,总重量超重的

    22、概率是多少?(人的体重服从正态分布)x 抽样分布例题抽样分布例题 20002.0)5355.3(1)75(5355.318/67075=xPxzxx超重的概率只有0.0002!x 的抽样分布例题的抽样分布例题 3u 视频:喝水的问题x 样本比例的抽样分布样本比例的抽样分布u从一个某特征比例为 的总体中抽取一个大小为 的SRS,用 表示该特征的样本比例,当样本足够大时:u 的分布为近似正态分布(approximately normal)u抽样分布的平均值和 相等u抽样分布的标准差是 pnPpp(1p)nP样本比例的抽样分布总体比例的抽样分布例题u假设成年人中有15%的人经常慢跑。一项健康调查询问了500位成人的SRS,问:(1)样本中的慢跑者比例 的抽样分布是什么?(2)根据68-95-99.7法则,样本中的慢跑者至少占11.8%的概率是多少?P样本方差的抽样分布样本方差的抽样分布样本方差的抽样分布样本方差的抽样分布

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:《抽样与抽样分布》课件.ppt
    链接地址:https://www.163wenku.com/p-4784351.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库