书签 分享 收藏 举报 版权申诉 / 80
上传文档赚钱

类型统计学ppt课件-PPT课件.ppt

  • 上传人(卖家):三亚风情
  • 文档编号:3525767
  • 上传时间:2022-09-11
  • 格式:PPT
  • 页数:80
  • 大小:1.05MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《统计学ppt课件-PPT课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    统计学 ppt 课件
    资源描述:

    1、第七章第七章 参数估计参数估计 本章估计都是在本章估计都是在的条的条 件下来讨论的。件下来讨论的。7.1.1:用来估计总体参数的统计量的名称。如样本均值,样本比例、样本方差等n例如:样本均值就是总体均值 的一个估计量2)参数用 表示,估计量用 表示:估计参数时计算出来的统计量计算出来的统计量的具体值n如果样本均值 x=80,则80就是的估计值:1).通过样本获取一些基本的统计量,然后利用这些基本统计量与总体参数之间的联系,(获得统计量的分布)利用有关统计方法,估计总体参数。2).由此可以看出,统计量与总体参数、估计量的不同:总体参数通常是未知的定数,是待估计定数,是待估计量量;统计量是根据样本

    2、计算的函数,通常是随机变量(对于总体而言);估计量用来对总体参数进行估计的统计量。参数估计的方法参数估计的方法7.1.2.n点估计与区间估计是统计估计的两种具体的方法。二者的基本出发点是不同的。n点估计主要是想利用统计量来估计总体参数的一个定值定值。n区间估计则是利用统计量的相应分布,估计包含总体参数的随机区间随机区间。n共同的是二者都是对总体参数的一种估计。1.用样本的估计量直接作为总体参数的估计值例如:用样本均值直接作为总体均值的估计例如:用两个样本均值之差直接作为总体均值之差的估计2.没有给出估计值接近总体参数程度的信息3.点估计的方法有矩估计法、最大似然法、最小二乘法等7.1.2评价估

    3、计量的标准评价估计量的标准(一般含义)1、无偏性无偏性:,称是 的无偏估计量 。2、有效性有效性。一个具有较小变异的统计量的意义在于将有更多的机会产生一个更接近于总体参数的量。3、一致性一致性。随着样本容量的增大,点估计量的值越来越接近被估计总体参数。)(E无偏性无偏性(unbiasedness)n无偏性:无偏性:估计量抽样分布的数学期望等于被 估计的总体参数 有效性有效性(efficiency)12一致性一致性(consistency)n一致性:一致性:随着样本容量的增大,估计量的 值越来越接近被估计的总体参数为的无偏、有效、一致估计量;为的无偏、有效、一致估计量;为的无偏、有效、一致估计量

    4、为的无偏、有效、一致估计量 为的无偏、有效、一致估计量为的无偏、有效、一致估计量。x21ns2p7.1.3区间估计区间估计(interval estimate)在点估计的基础上,给出总体参数估计的一个区间区间范围范围,该区间由样本统计量加减估计误差而得到的根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量n比如,某班级平均分数在7585之间,置信水平是95%置信水平=1-当总体服从正态分布当总体服从正态分布N(,2)时,(时,(2已知已知)来自来自该总体的所有容量为该总体的所有容量为n的样本的均值的样本的均值 x也服从正态也服从正态分布,分布,x 的数学期望为的数学期

    5、望为,方差为,方差为2/n即即 xN(,2/n)1)(2znxp/2 1)(2nxpz1ULP区间估计的数学表达方式:区间估计的数学表达方式:122ZxZPx区间估计基本表达区间估计基本表达(以估计(以估计 为例):为例):STATSTAT区间估计的图示区间估计的图示xxzx2将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平 表示为(1-n 为是总体参数未在区间内的比例 常用的置信水平值置信水平值有 99%,95%,90%n相应的相应的 为:0.01,0.05,0.10n 的值:2.58,1.96,1.645(记住记住)z2 xxx影响区间宽度的因素影响区间

    6、宽度的因素 p2071.总体数据的离散程度,总体数据的离散程度,用用 来测度来测度2.样本容量,样本容量,3.置信水平置信水平(1-),影响,影响 z 的大小的大小nx1.置信水平为置信水平为95%的置信区间,意思是在构造的置信区间,意思是在构造的所有置信区间当中,包含总体参数真值的区间的所有置信区间当中,包含总体参数真值的区间占占95%。2.总体参数的真值是固定的、未知的,而用样总体参数的真值是固定的、未知的,而用样本构造的置信区间是不固定的。一个样本构造一本构造的置信区间是不固定的。一个样本构造一个区间,不同样本构造不同的区间,因此置信区个区间,不同样本构造不同的区间,因此置信区间是随机区

    7、间。置信水平是针对随机区间而言,间是随机区间。置信水平是针对随机区间而言,不是所有区间都包含总体参数的真值。不是所有区间都包含总体参数的真值。3.在实际问题中,进行估计时,往往只抽取一在实际问题中,进行估计时,往往只抽取一个样本。由该样本所构造的区间是一个特定的区个样本。由该样本所构造的区间是一个特定的区间,而不再是随机区间,因此该区间是否包含总间,而不再是随机区间,因此该区间是否包含总体参数的真值,我们是不知道的。体参数的真值,我们是不知道的。7.2 一个总体参数的区间估计一个总体参数的区间估计p211n7.2.1.总体均值的区间估计总体均值的区间估计n7.2.2.总体比例的区间估计总体比例

    8、的区间估计n7.2.3.总体方差的区间估计总体方差的区间估计总体参数总体参数符号表示符号表示样本统计量样本统计量均值均值比例比例方差方差2xp2s7.2.1总体均值的区间估计总体均值的区间估计(大样本大样本)1.假定条件假定条件n总体服从正态分布总体服从正态分布,且方差且方差()已知或者未知已知或者未知n如果不是正态分布,可由正态分布来近似如果不是正态分布,可由正态分布来近似(n 30)2.使用正态分布统计量使用正态分布统计量 z(标准化标准化)1,0(Nnxz)(22未知或nszxnzx边际误差总体均值的区间估计总体均值的区间估计(例题分析例题分析)【例例】一家食品生产企业以生产袋装食品为主

    9、,为对产量质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分分布服从正态分布,布,且总体标准差为10g。试估计该批产品平均重量的置信区间,置信水平为95%25袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3已知已知N(,102),n=25,1-=95%,z/

    10、2=1.96。根。根据样本数据计算得:据样本数据计算得:总体均值总体均值 在在1-置信水平下的置信区间为置信水平下的置信区间为28.109,44.10192.336.105251096.136.1052nzx该食品平均重量的置信区间为101.44g109.28g36.105x36个投保人年龄的数据个投保人年龄的数据 233539273644364246433133425345544724342839364440394938344850343945484532已知已知n=36,1-=90%,z/2=1.645。根据样本数据。根据样本数据计算得:计算得:,总体均值总体均值 在在1-置信水平下的置信

    11、区间为置信水平下的置信区间为63.41,37.3713.25.393677.7645.15.392nszx投保人平均年龄的置信区间为投保人平均年龄的置信区间为37.37岁岁41.63岁岁5.39x77.7s计算样计算样本统计本统计量量确定样确定样本统计本统计量分布量分布确定临确定临界值保界值保证概率证概率确定置确定置信区间信区间xxxZxZxxxZxZx,区间估计步骤区间估计步骤(以估计(以估计 为例):为例):STATSTAT其中:xnSTATSTAT例:由例:由532名名商业周刊商业周刊订阅者订阅者组成的样本表明,其每周使用因特网的组成的样本表明,其每周使用因特网的平均时间为平均时间为6.

    12、7小时。如果总体标准差为小时。如果总体标准差为5.8小时,求该周刊订阅者总体每周平均小时,求该周刊订阅者总体每周平均花费在因特网上时间的花费在因特网上时间的95置信区间。置信区间。均值的区间估计均值的区间估计nx96.12Z则:该置信区间为:则:该置信区间为:5328.596.17.62nZx19.7,21.6正态总体或非正态总体但大正态总体或非正态总体但大样本,总体方差未知样本,总体方差未知均值的区间估计均值的区间估计11212nSZxnSZxPnnnSZxnSZxnn1212,STATSTAT使用使用 t 分布统计量分布统计量)1(ntnsxtnstx2 正态总体小样本,总体方差未知正态总

    13、体小样本,总体方差未知 p214均值的区间估计均值的区间估计11212nStxnStxPnnnStxnStxnn1212,t 统计量统计量16灯泡使用寿命的数据灯泡使用寿命的数据 15101520148015001450148015101520148014901530151014601460147014702.1503,8.14762.1314901677.24131.214902nstx1490 x77.24s均值推断方法的选择均值推断方法的选择 p217n是否为大样本是否为大样本 是否已知是否已知是否正态总体是否正态总体 是否已知是否已知用用S 估估计计 用用S 估估计计 增大样本增大样本

    14、容量到容量到30以上以上是是是是是是是是否否否否否否否否nZx2nZx2nSZx2nStx2查教材查教材P155)1,0()1(Nnpppz)()-1()1(22未知时或nppzpnzp【例】【例】某城市想要估计下岗职工中女性所占的比例,随机地抽取了100名下岗职工,其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间%35.74%,65.55%35.9%65100%)651%(6596.1%65)1(2nppzp11222nsn111122122222nsnnsn25袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.5

    15、95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3401.12)24()1(2975.0212n364.39)24()1(2025.022n39.18083.56401.1221.93125364.3921.93125227.2.4正态总体未来观察值的预测区间估计正态总体未来观察值的预测区间估计p220预测随机变量未来的观察值,并希望求出各某个未来观察预测随机变量未来的观察值,并希望求出各某个未来观察值的取值范围,这个范围就是对某个未来观察值的预测区值的取值范围,这个

    16、范围就是对某个未来观察值的预测区间估计间估计n以7.3为例,估计一个新灯泡使用寿命的区间预测误差的期望为,预测误差的方差为未来观察值经标准化后服从标准正态分布,当用样本方差未来观察值经标准化后服从标准正态分布,当用样本方差s2代替总体方差代替总体方差 2后,则服从后,则服从t分布分布新观察值新观察值95%的预测区间为的预测区间为0)(1xxEnn11nxxD2221nnstx112未来观察值的预测区间估计未来观察值的预测区间估计p222【例】【例】利用例利用例7.3的数据,假定你要购买一只新的灯的数据,假定你要购买一只新的灯,以,以95%的置信水平建立该只灯泡的预测区间的置信水平建立该只灯泡的

    17、预测区间149054.4=(1435.6,1544.4),该只新灯泡使用,该只新灯泡使用寿命寿命95%的预测区间为的预测区间为1435.6h1544.4h时之间时之间。与总体均值的置信区间。与总体均值的置信区间(1476.8,1503.2)相比,相比,新灯泡的预测区间要长得多新灯泡的预测区间要长得多161177.24131.21490解:根据已知结果得解:根据已知结果得区间估计练习区间估计练习一、假定容量一、假定容量n=100的一个随机样本的一个随机样本 产生均值为产生均值为81和标准差和标准差s=12。要求:。要求:构造总体均值构造总体均值95.45%置信水平下的置信区间;置信水平下的置信区

    18、间;构造总体均值构造总体均值99.73%置信水平下的置信区间。置信水平下的置信区间。二、一个容量为二、一个容量为400的随机样本取自均值和标准差的随机样本取自均值和标准差均未知的总体。已经计算出下列值:均未知的总体。已经计算出下列值:=14592要求:要求:构造总体均值构造总体均值95%置信水平下的置信区间;置信水平下的置信区间;构造总体均值构造总体均值99%置信水平下的置信区间。置信水平下的置信区间。8121.2;8131.2;(5.71.962/20)xx2280 xixi2两个总体参数的区间估计两个总体参数的区间估计总体参数总体参数符号表示符号表示样本统计量样本统计量2121222121

    19、xx 21pp 2221ss)1,0()()(2221212121Nnnxxz 222121221)(nnzxx222121221)(nsnszxx 两个样本的有关数据两个样本的有关数据 中学中学1中学中学2n1=46n1=33S1=5.8 S2=7.2861x782x)97.10,03.5(97.28332.7468.596.1)7886()(22222121221nsnszxx2)1()1(212222112nnsnsnsp21221211nnsnsnsppp)2(11)()(21212121 nntnnsxxtp 21221221112nnsnntxxp两个方法组装产品所需的时间两个方法

    20、组装产品所需的时间 方法方法1方法方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.55.321x996.1521s8.282x358.1922s677.1721212358.19)112(996.15)112(2ps56.37.3121121677.170739.2)8.285.32()()()(2221212121vtnsnsxxtn两个总体均值之差1-2在1-置信水平下的置信区间为222121221)(nsnsvtxx1222221121212

    21、222121nnsnnsnsnsv两个方法组装产品所需的时间两个方法组装产品所需的时间 方法方法1方法方法228.336.027.631.730.137.222.226.529.038.531.037.634.433.832.128.020.028.830.030.25.321x996.1521s875.272x014.2322s13188.13188014.2311212996.158014.2312996.15222v433.4625.48014.2312996.151604.2)875.275.32(例题分析)10名学生两套试卷的得分名学生两套试卷的得分 学生编号学生编号试卷试卷A试卷试

    22、卷B差值差值d17871726344193726111489845691741754951-27685513876601698577810553916222111221)1()1(nppnppzpp在某个电视节目的收视率调查中,农村随机调查了400人,有32%的人收看了该节目;城市随机调查了500人,有45%的人收看了该节目。试以90%的置信水平估计城市与农村收视率差别的置信区间%32.19,%68.6%32.6%13400%)321(%32500%)451(%4596.1%32%451.比较两个总体的方差比2.用两个样本的方差比来判断如果S12/S22接近于1,说明两个总体方差很接近如果S1

    23、2/S22远离1,说明两个总体方差之间存在差异3.总体方差比在1-置信水平下的置信区间为212221222122221FssFss),(1),(1222121nnFnnF5201x26021s4802x28022s505.028026098.12802602221(P234)估计总体均值时样本容量的确定估计总体均值时样本容量的确定2.估计总体比例时样本容量的确定估计总体比例时样本容量的确定3.估计两个总体均值之差时样本容量的估计两个总体均值之差时样本容量的确定确定4.估计两个总体比例之差时样本容量的估计两个总体比例之差时样本容量的确定确定估计总体均值时样本容量估计总体均值时样本容量n为为样本容

    24、量样本容量n与总体方差与总体方差 2、边际误差、边际误差E、可、可靠性系数靠性系数Z或或t之间的关系为之间的关系为与总体方差成正比与总体方差成正比与边际误差成反比与边际误差成反比与可靠性系数成正比与可靠性系数成正比2222)(Ezn拥有工商管理学士学位的大学毕业生拥有工商管理学士学位的大学毕业生年薪的标准差大约为年薪的标准差大约为2000元,假定想要估计元,假定想要估计年薪年薪95%的置信区间,希望边际误差为的置信区间,希望边际误差为400元,应抽取多大的样本容量?元,应抽取多大的样本容量?9704.964002000)96.1()(2222222Ezn222)1()(EznnzE)1(2根据

    25、以往根据以往的生产统计,某的生产统计,某种产品的合格率种产品的合格率约为约为90%,现要,现要求 边 际 误 差 为求 边 际 误 差 为5%,在求,在求95%的置信区间时,的置信区间时,应抽取多少个产应抽取多少个产品作为样本?品作为样本?1393.13805.0)9.01(9.0)96.1()1()(22222Ezn:n1、n2、总体方差不知时,可用历史方差、总体方差不知时,可用历史方差、样本方差代替。如有多个方差共选用,样本方差代替。如有多个方差共选用,一般选取最大的方差;一般选取最大的方差;n3、设设n1和和n2为来自两个总体的样本,并假定为来自两个总体的样本,并假定n1=n2根据均值之

    26、差的区间估计公式可得两个样根据均值之差的区间估计公式可得两个样本的容量本的容量n为为222212221)()(EznnnnzE212一所中学的教务处想要估计试验班和普通一所中学的教务处想要估计试验班和普通班考试成绩平均分数差值的置信区间。要求置信班考试成绩平均分数差值的置信区间。要求置信水平为水平为95%,预先估计两个班考试分数的方差分,预先估计两个班考试分数的方差分别为:试验班别为:试验班 12=90,普通班,普通班 22=120。如果。如果要求估计的误差范围要求估计的误差范围(边际误差边际误差)不超过不超过5分,在分,在两个班应分别抽取多少名学生进行调查?两个班应分别抽取多少名学生进行调查?17464.165)12090(96.1)()(22222212221Eznn设n1和n2为来自两个总体的样本,并假定n1=n2根据比例之差的区间估计公式可得两个样本的容量n为nzE)1()1(22112222112221)1()1()(Eznn08.1921.0)5.01(5.0()5.01(5.096.1)1()1()(22222112221Eznn

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:统计学ppt课件-PPT课件.ppt
    链接地址:https://www.163wenku.com/p-3525767.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库