书签 分享 收藏 举报 版权申诉 / 59
上传文档赚钱

类型《统计学基础》课件7-8章 统计抽样技术相关关系分析技术.ppt

  • 上传人(卖家):momomo
  • 文档编号:5034529
  • 上传时间:2023-02-04
  • 格式:PPT
  • 页数:59
  • 大小:2.32MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《《统计学基础》课件7-8章 统计抽样技术相关关系分析技术.ppt》由用户(momomo)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    统计学基础 统计学基础课件7-8章 统计抽样技术,相关关系分析技术 统计学 基础 课件 统计 抽样 技术 相关 关系 分析
    资源描述:

    1、第七章第七章 统计抽样估计统计抽样估计 教学目的:教学目的:1.了解统计抽样的概念和特点;了解统计抽样的概念和特点;2.掌握抽样平均误差、抽样极限误差的计算;掌握抽样平均误差、抽样极限误差的计算;3.熟练掌握区间估计方法;熟练掌握区间估计方法;4.掌握必要样本单位数的确定方法。掌握必要样本单位数的确定方法。重点:重点:简单随机抽样组织形式的区间估计方法简单随机抽样组织形式的区间估计方法难点:难点:区别抽样误差、抽样平均误差和抽样极限误差区别抽样误差、抽样平均误差和抽样极限误差第一节第一节 统计抽样概述统计抽样概述一、统计抽样的概念一、统计抽样的概念(一)统计抽样的概念统计抽样是抽样调查和抽样推

    2、断的总称,它是按照随机原则从被研究现象总体中抽取部分单位进行调查,并根据对这部分单位的调查结果对总体的数量特征作出具有一定可靠性的估计和推断,从而认识总体的一种统计方法。例如,在某地区100万户居民中,随机抽取1000户居民进行家庭收入情况调查,以此来推断该地区100万户居民的家庭收入情况,这种方式就是统计抽样。(二)抽样调查的特点(二)抽样调查的特点1.遵循随机原则从调查总体中抽取调查单位遵循随机原则从调查总体中抽取调查单位2以样本的数量特征推断总体的数量特征。以样本的数量特征推断总体的数量特征。3抽样误差可以事先计算并加以控制。抽样误差可以事先计算并加以控制。4运用了概率估计的方法运用了概

    3、率估计的方法二、抽样调查的作用二、抽样调查的作用1对某些不可能进行全面调查而又需要了解全面情况的社对某些不可能进行全面调查而又需要了解全面情况的社会经济现象,可以用抽样法来了解其全面情况。会经济现象,可以用抽样法来了解其全面情况。4可用于生产过程中的质量控制。可用于生产过程中的质量控制。3可以对全面调查的资料加以补充和修订。可以对全面调查的资料加以补充和修订。2对于需要及时了解情况的现象,也经常采用抽样技术。对于需要及时了解情况的现象,也经常采用抽样技术。三、统计抽样的基本概念三、统计抽样的基本概念(一)全及总体和样本总体1全及总体,又称总体或母体,是所要认识研究对象的全体,它是由具有某种共同

    4、性质的许多单位所组成的集合体。全及总体的单位数通常用N表示。如前例中,100万户居民就是全及总体,N100万。2样本总体,也称样本或子样,是指从全及总体中按照随机原则抽取的那部分个体所组成的集合体。样本总体的单位数称为样本容量,通常用n表示。(二)全及指标和样本指标1全及指标,也称总体指标或总体参数,是根据全及总体各单位标志值计算的反映总体数量特征的综合指标。常用的全及指标有总体平均数()、总体成数(P)、总体标准差()和总体方差(2)。总体中具有某一属性的单位数占总体单位数的比重,一般用P表示,即 ;总体中不具有某一属性的单位数占总体单位数的比重,一般用Q表示,即,则有 。统计中通常把这样的

    5、两种比重称为成数。X1NpN0NQN1PQ(三)抽样的方法在抽样调查中,从全及总体中抽取样本单位的方法有两种:重复抽样和不重复抽样。1重复抽样,又称重置抽样或回置抽样,是指从总体中抽出一个单位后,把结果登记下来,再放回总体中参加下一次的抽选。重复抽样每次都是从全部总体单位中抽选,每个单位被抽中的机会在各次中是完全相同的,且有多次被抽中的可能。A B C D AA AB AC AD BA BB BC BD CA CB CC CD DA DB DC DDA B C D(图6-1)其样本数目用公式计算为:Nn4216(个)nNA 2、不重复抽样,考虑顺序:样本组合数目如图2:AA AB AC ADB

    6、A BB BC BD CA CB CC CD DA DB DC DD A B C DA B C D(图6-2)其样本数目用公式计算为:)!(!nNN)!24(!4 12123412(个)nNB3、重复抽样,不考虑顺序,样本组合数目如图3:AA AB AC ADBA BB BC BD CA CB CC CD DA DB DC DDA B C D A B C D(图6-3)其样本数目用公式计算为:CnN+n-1 )!1(!)!1(NnnN)!14(!2)!124(10(个)4、不重复抽样,不考虑顺序:样本组合数目如图4:AA AB AC ADBA BB BC BD CA CB CC CD DA D

    7、B DC DDA B C DA B C D (图6-4)其样本数目用公式计算为:)!(!nNnN)!24(!2!46(个)从以上样本数目来看,重复抽样个数大于不重复抽样个数。nND(五)抽样的组织形式1简单随机抽样简单随机抽样,又称为纯随机抽样,它是按照随机原则直接从总体N个单位中抽取n个单位组成样本,使总体中每个单位都有同等的被抽中的机会。抽签法 随机数字表法2分层抽样分层抽样,也称分类抽样或类型抽样,它是先将总体各单位按某一标志分组,然后在各组中随机抽取单位构成样本的抽样组织形式。3等距抽样等距抽样,也称机械抽样或系统抽样,它是先将总体各单位按某一标志排序,然后按相等的距离抽取单位构成样本

    8、的抽样组织形式。4整群抽样整群抽样,也称成组抽样。前面介绍的三种抽样组织形式都是一个一个地抽取样本单位,故也称为个体抽样。第二节第二节 抽样误差抽样误差一、抽样误差的概念一、抽样误差的概念 要了解抽样的概念,必须正确认识误差的不同类型,准确地把握抽样误差的概念。1、计量误差;2、记录误差;3、计算误差;4、抄录误差;5、汇总误差;6、调查者、被调查者有意虚报或瞒报造成的误差。1、偏差:破坏了随机原则产生的偏差(系统性误差)(1)实际误差(绝对误差)|X x|Pp|(2)抽样平均误差 x,p 2、抽样随机 性误差 登记误差 抽样代表性 统计误差 (图6-5),二、影响抽样误差大小的因素二、影响抽

    9、样误差大小的因素 抽样误差的大小受以下几个因素的影响:1样本单位数(样本容量n)的多少。2总体各单位标志值的变异程度。3抽样方法。4抽样组织形式。三、抽样平均误差三、抽样平均误差从一个总体中可以抽取许多个样本,每个样本指标与总体指标之间的离差称为抽样实际误差。但是在实践中总体指标数值往往是未知的,因此抽样实际误差是无法计算的。在实际工作中是以抽样平均误差来衡量抽样误差大小的 2()xxXMMPpp2)()(2312276件nxxx Txxi2)(1220 667.11.291.29(件)(件)从这里我们可以看出,复重抽样的抽样平均误差大从这里我们可以看出,复重抽样的抽样平均误差大于不重复抽样的

    10、抽样平均误差。于不重复抽样的抽样平均误差。用定义公式计算抽样平均误差很麻烦,在实际工作中用定义公式计算抽样平均误差很麻烦,在实际工作中,也是难以做到的。能不能将定义公式转换成适用公式,也是难以做到的。能不能将定义公式转换成适用公式?数理统计研究证明,是可以的。因为:抽样平均误差?数理统计研究证明,是可以的。因为:抽样平均误差就是所有可能出现的样本指标和总体指标的平均离差,就是所有可能出现的样本指标和总体指标的平均离差,所有可能的抽样平均数的平均数,就是总体平均数的数所有可能的抽样平均数的平均数,就是总体平均数的数学期望学期望 ,即:,即:)(xEx=nxx2)(nXEx2)(两边平方得:2xE

    11、(ix X)2 E nxxxn.21 nXn 2 E nXxXxXxn)(.)()(212 )(2)(.)()(1222212XxXxEXxEXxEXxEnjijin 由于)(xxi0 ,E)(xxi2 2,则上式:nnnnn222222212).(1两边开方:,nnx2这是重复抽样的抽样平均误差公式。对于不重复抽样,则要在根号内加乘修正系数:)1(2NnNnx,当N100时,1可忽略不计,则变成:=)1(2Nnn在小样本条件(小于30)下,仍用系数)1(NnN。未知的情况下,也可以用S代替,计算 在 x 结合6.1例,重复抽样条件下:首先,我们计算总体标准差:见表6-3:60000N 300

    12、n 300698%300p【例例7-37-3】一批罐头共一批罐头共6000060000桶,随机抽查桶,随机抽查300300桶,发现有桶,发现有6 6桶不合格,求合格率的抽桶不合格,求合格率的抽样平均误差。样平均误差。已知:已知:p(1)PPn98%2%0.808%300p(1)98%2%300(1)(1)0.806%30060000pPPnunN在重复抽样条件下,在重复抽样条件下,在不重复抽样条件下,在不重复抽样条件下,p四、抽样极限误差四、抽样极限误差xxX ppP xxt 概率与概率度如图概率与概率度如图6-5 6-5 表表6-56-5:(图6-6)【例7-4】已知某乡粮食亩产量的标准差为

    13、公斤,总体单位数为亩,现重复随机抽取400亩进行调查,求得其抽样平均误差为查 正态分布概率表,当t=2时,置信度F(t)为95.45%。804400 xn824xxt第三节第三节 总体指标推断总体指标推断一、点估计一、点估计点估计,也称定值估计,它是直接以样本指标的实际值作为相应总体指标的估计值。用公式表示为:xXPp 二、区间估计二、区间估计PpXxpxppxXpPpxXx【例7-6】某地区种植小麦4000亩,重复随机抽取200亩进行试验,测得结果:平均亩产量300千克,抽样总体的标准差为6千克,试求在概率为95.45%的保证下,小麦的平均亩产量的可能范围是多少?所以,小麦平均亩产量的可能范

    14、围是3000.84,即299.16300.84千克。60.42200 xsn()95.45%F t 2 0.420.84xxt 2()xxf按重量分组按重量分组/克克/包包包数包数/包包xxf6668687070727274747626642676971737513441442629215028.8819.440.2419.3635.28合计合计20-1416103.20试以试以95.45%的概率保证程度推算:的概率保证程度推算:这批食品的平均每包重量是否符合规定要求;这批食品的平均每包重量是否符合规定要求;若每包食品重量低于若每包食品重量低于70克为不合格,求合格率的范围。克为不合格,求合格

    15、率的范围。141670.820 xfxf2103.22.2720 xxfsf2.2721.0220 xxsttn 这批食品平均每包重量的范围是这批食品平均每包重量的范围是70.81.02,即,即69.7871.82克。克。所以,这批食品平均每包重量不符合规定要求。所以,这批食品平均每包重量不符合规定要求。1260%20p 140%60%22 10.95%21.91%20ppppttn 所以,合格率的范围是所以,合格率的范围是60%21.91%,即,即38.09%81.91%。第四节第四节 必要样本数目的确定必要样本数目的确定一、影响必要样本单位数的因素一、影响必要样本单位数的因素一般地,在确定

    16、抽样单位数时,必须考虑以下因素:1.总体方差的大小。2.抽样极限误差的大小。3.抽样推断的可靠程度。4.抽样方法与组织形式。二、抽样单位数的确定二、抽样单位数的确定 抽样必要单位数,可以根据抽样允许(极限)误差中的n来确定。在重复抽样中:由于 xxt,ntx2,方程两边平方:,pptn,tnntpx22222222x)1(:,成数的抽样个数则为平均数的抽样个数为在不重复抽样中:)1-(2xNnNnt两边平方,可得到)1-(-)1-()-(2222222NnntNtNnnNtx 则)1-()1-(-2x2x2222NnNnntNt)1()1-(2x222x2222NtnNnntNt2222)1-

    17、(2tNNtnx当N很大,例如大于100时,N-1约等于N,则222x22tNNtn 同理,成数的必要抽样个数为:)-1()-1(222pptNppNtnp在小样本时,则为:)-1()1-()-1(222pptNppNtnp 由此可见,影响样本容量n的因素主要有总体方差,允许误差,概率度,总体单位数。【例7-8】某企业生产某种产品日产量为10000只标准件,根据以往经验,产品的一级品率为90%,现在用重复抽样的方法进行产品质量检验,要求一级品率的抽样极限误差不超过2%,而概率保证程度不低于95.45%,试计算应抽取多少产品?2222(1)290%(1 90%)9002%pt ppn10000,

    18、90%,2%pNp 95.45%F t 95.45%,2F tt【例7-9】某市开展职工家计调查,根据历史资料该市职工家庭平均每人每年收入的标准差为250元,而家庭消费的恩格尔系数为65。现在用重复抽样的方法,要求在95.45的概率保证下,平均收入的极限误差不超过20元,恩格尔系数的极限误差不超过4,求必要的样本单位数。根据公式,在重复抽样条件下,样本平均数的单位数:2222222(250)625(20)xtn户户569)04.0(35.065.02)1(2222ppptn第第8章章 相关与回归分析技术相关与回归分析技术教学目标:教学目标:本章的目的在于帮助学生了解相关关系的概念与种类,掌握判

    19、断现象之间相关方向和相关程度的技能,理解相关分析与回归分析之间的关系,掌握利用简单直线回归模型对经济数据进行分析和预测的技能,会绘制相关散点图,计算相关系数,建立回归模型,利用回归方程式对现象进行分析与预测。重点:重点:1相关系数的计算 2回归方程式的确定3利用相关与回归分析的方法对现象进行分析与预测难点:难点:回归分析中两个参数计算公式的推导第一节第一节 相关分析的意义相关分析的意义一、相关关系的概念与特点一、相关关系的概念与特点(一)相关关系的概念(二)相关关系的特点现象之间的相关关系具有以下几个特点。1.现象之间客观存在着相互依存的数量关系2.具有相关关系的两个变量之间的关系是对等的3.

    20、现象之间客观存在的这种数量依存关系不确定、不唯一、不精确二、相关关系的种类二、相关关系的种类(一)按相关关系的密切程度划分,可以分为完全相(一)按相关关系的密切程度划分,可以分为完全相关、不完全相关和不相关关、不完全相关和不相关(二)按相关关系的方向来划分,可以分为正相关与(二)按相关关系的方向来划分,可以分为正相关与负相关负相关(三)按相关关系的表现形式来划分,可以分为线性(三)按相关关系的表现形式来划分,可以分为线性相关与非线性相关相关与非线性相关(四)按相关关系影响因素的多少来划分,可以分为(四)按相关关系影响因素的多少来划分,可以分为单相关与复相关单相关与复相关第二节第二节 相关分析相

    21、关分析一、相关表和相关图一、相关表和相关图(一)相关表(二)相关图(一)相关系数的定义二、相关系数二、相关系数22222111yyxxyyxxyynxxnyyxxnryxxy2222 yynxxnyxxynr(二)相关系数的性质(三)相关密切程度划分的标准(四)相关系数的计算2222 yynxxnyxxynr企业编号企业编号n产品销售额产品销售额x/万万元元销售利润销售利润y/万元万元xyx2y21 26022 5 720 67 600 4842 31026 8 060 96 100 6763 3503010 500 122 500 9004 4203514 700 176 4001 2255

    22、 5304021 200 280 9001 6006 7206244 640 518 4003 8447 8106552 650 656 1004 2258 9507571 250 902 5005 62591 0308082 4001 060 9006 400101 1008694 6001 210 0007 396合合 计计6 480521405 7205 091 40032 375从表8-2可知:n=10,6 480,521,405 720,5 091 400,32 375,将数据代入简捷计算公式得:2222 yynxxnyxxynr2210 4057206480 52110 50914

    23、00648010 323755210.996932第三节第三节 直线回归分析直线回归分析一、回归分析的含义一、回归分析的含义(一)回归分析的概念(二)回归分析的类型根据不同的标准,对回归分析可以进行不同的分类。1.根据回归分析中变量间的表现形态不同,可分为线性回归(直线回归)分析与非线性回归(曲线回归)分析。2.根据回归分析中自变量数量的多少来分,可分为一元回归分析与多元回归分析。二、简单线性回归方程的建立二、简单线性回归方程的建立(一)简单线性回归方程的确立(二)简单线性回归分析的特点(三)简单线性回归的应用序号序号年广告费用年广告费用/万元万元年销售量年销售量/万台万台1101222015

    24、330184403055037660407705088061990651010072要求:(要求:(1)计算广告费用与销售量之间的相关系数,并说明其相关程度。)计算广告费用与销售量之间的相关系数,并说明其相关程度。(2)对广告费用与销售量进行回归分析,确定回归方程,并解释回归系)对广告费用与销售量进行回归分析,确定回归方程,并解释回归系数的经济含义。数的经济含义。(3)进行预测,当广告费用达到)进行预测,当广告费用达到150万元时,产品销售量可以达到多少万台?万元时,产品销售量可以达到多少万台?解:(解:(1)计算相关系数时不必区分自变量与因变量,而在进行简单线性回)计算相关系数时不必区分自变

    25、量与因变量,而在进行简单线性回归分析时,需要区分自变量与因变量,因此,这里以年广告费用为自变量归分析时,需要区分自变量与因变量,因此,这里以年广告费用为自变量x,年销年销售量为因变量售量为因变量y。建立相关系数计算表,如下表。建立相关系数计算表,如下表8-4所示。所示。序号序号n年广告费用年广告费用x/万万元元年销售量年销售量y/万台万台xyx2y21 10 12 120 100 1442 20 15 300 400 2253 30 18 540 900 3244 40 30 1 200 1 600 9005 50 37 1 850 2 500 1 3696 60 40 2 400 3 600

    26、 1 6007 70 50 3 500 4 900 2 5008 80 61 4 880 6 400 3 7219 90 65 5 850 8 100 4 22510100 72 7 20010 000 5 184合合 计计55040027 84038 50020 1922222 yynxxnyxxynr2210 27840550 40010 3850055010 201924000.993059(2)配合回归模型根据计算公式,采用最小二乘法对两)配合回归模型根据计算公式,采用最小二乘法对两个待定参数进行计算得个待定参数进行计算得:220.707879nxyxybnxx 1.066667ybx

    27、aybxnn因此,回归直线方程为:因此,回归直线方程为:yc=a+bx=1.066 667+0.707 879x回归系数回归系数b的含义为:当广告费用增加的含义为:当广告费用增加1万元时,产品销万元时,产品销售量平均增加售量平均增加0.707 879万台。万台。三、回归分析与相关分析的区别与联系三、回归分析与相关分析的区别与联系(一)回归分析与相关分析的联系1.相关分析是回归分析的基础与前提条件2.回归分析是相关分析的继续与深入(二)回归分析与相关分析的区别1.说明问题的深浅不同2.研究变量的性质不同四、回归估计标准误差四、回归估计标准误差(一)估计标准误差的概念(二)估计标准误差的计算我们把

    28、回归方程yc=a+bx代入上式估计标准误差的定义公式,可得到计算估计标准误差的简捷公式:22nyyScyx22nxybyaySyx220192-1.066667 400-0.707879 27840210-22.69yxyaybxySn(三)估计标准误差与相关系数的关系221yyxsrrsyyx21nyyy2(四)回归系数与相关系数的关系我们也能很容易的证明,回归系数与相关系数之间具有以下的关系。我们前面已经知道:2222nxyxyrnxxnyy 22 xxnyxxynbxyxxyyxnxxxynyyyxxxxxyyyyyxxnyynrb222222222222)()()(2)(222xyrbyxbr(五)一元线性回归置信区间(六)应用相关回归分析应注意的几个问题1.要注意定性分析与定量分析相结合。2.要检验相关系数与注意回归方程的有效性。3.要考虑现象的复杂性并注意具体问题具体分析。yxctsy

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:《统计学基础》课件7-8章 统计抽样技术相关关系分析技术.ppt
    链接地址:https://www.163wenku.com/p-5034529.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库