书签 分享 收藏 举报 版权申诉 / 65
上传文档赚钱

类型第七章相关分析和回归分析课件.ppt

  • 上传人(卖家):晟晟文业
  • 文档编号:5177602
  • 上传时间:2023-02-16
  • 格式:PPT
  • 页数:65
  • 大小:963.51KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《第七章相关分析和回归分析课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    第七 相关 分析 回归 课件
    资源描述:

    1、w第一节 变量间的相关关系w第二节 简单回归分析w第三节 多元回归分析第一节第一节 变量间的相关关系变量间的相关关系相关的概念相关分析的内容相关系数及其计算相关系数的检验一、变量相关的概念一、变量相关的概念变量间的函数关系变量间的函数关系是一一对应的确定关系设有两个变量 x 和 y,变量 y 随变量 x 一起变化,并完全依赖于 x,当变量 x 取某个数值时,y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y=f(x),其中 x 称为自变量,y 称为因变量1、某种商品的销售额(y)与销售量(x)之间的关系可表示为 y=p x(p 为单价)2、圆的面积(S)与半径之间的关系可表示为S=

    2、R2 3、企业的原材料消耗额(y)与产量(x1)、单位产量消耗(x2)、原材料价格(x3)之间的关系可表示为y=x1 x2 x3变量间的相关关系变量间的相关关系现象之间存在的一种非确定性的数量依存关系(家庭收入和储蓄)变量间关系不能用函数关系精确表达,一个变量的取值不能由另一个变量唯一确定。当变量 x 取某个值时,变量 y 的取值可能有几个。1、商品的消费量(y)与居民收入(x)之间的关系2、商品销售额(y)与广告费支出(x)之间的关系3、粮食亩产量(y)与施肥量(x1)、降雨量(x2)、温度(x3)之间的关系4、收入水平(y)与受教育程度(x)之间的关系5、父亲身高(y)与子女身高(x)之间

    3、的关系相关关系的类型相关关系的类型(课本第(课本第114页)页)相关关系相关关系正正相相关关负负相相关关相关方向相关方向变量多少变量多少单单相相关关复复相相关关相关形式相关形式线线性性相相关关非非线线性性相相关关完完全全相相关关中中度度相相关关低低度度相相关关相关程度相关程度弱弱相相关关高高度度相相关关相关关系的图示相关关系的图示二、相关分析的内容二、相关分析的内容(1)判断现象之间有无相关关系(2)判断相关关系的方向、表现形态和密切程度特点:w不必区分自变量和因变量w是回归分析的基础手段w定性分析、相关表、相关图、相关系数相关表和相关图相关表和相关图 将变量X与Y对应数据用统计表反映,形成相

    4、关表。探讨变量x,y的相关关系时,常须先做出散点图(Scatter Diagram),以坐标系上的点代表x,y的观察值,可以直观地考察变量之间联系程度,并且有助于选择合适的估计模型。相关表相关表 表表 10-1:Click 宝珠笔的地区调查结果宝珠笔的地区调查结果 地区地区 销售额销售额 (千美元)(千美元)广告广告 (电视时段(电视时段/月)月)X1X1 销售代表人数销售代表人数 X2X2 005005 260.3260.3 5 5 3 3 019019 286.1286.1 7 7 5 5 033033 279.4279.4 6 6 3 3 039039 410.8410.8 9 9 4

    5、4 061061 438.2438.2 1212 6 6 082082 315.3315.3 8 8 3 3 091091 565.1565.1 1111 7 7 101101 570.0570.0 1616 8 8 .“Click”公司对公司对40个销售地区的调查结果见表个销售地区的调查结果见表相关图相关图(见前(见前“相关关系的图示相关关系的图示”)图:图:Click宝珠笔的地区调查散点图宝珠笔的地区调查散点图 700 700 600 600 500 500 400 400 300 300 200 200 100 100 5 10 15 20 25 X1 2 4 6 8 10 X2 电 视

    6、 广 告(a)销 售 代 表 人 数(b)由“click”公司的散点图可以看到销售额随每月电视广告时数增加时增加(a图);某地区销售代表人数变多时,该地区的销售额也随之上升(b图)。a图和b图进一步表示销售额与各变量之间的关系呈直线关系。现在问题在于各变量之间的紧密关系究竟强到何种程度。这就涉及到一个常用的指标相关系数。三、相关系数及其计算三、相关系数及其计算1、对变量之间关系密切程度的度量2、对两个变量之间线性相关程度的度量称为简单相关系数(偏相关系数与复相关系数见课本第115页)yxrxy2xy 变量x和y的协方差 x变量x的标准差 y变量y的标准差nyynxxyyxxnyxxy222)(

    7、)()(1相关系数的演变公式相关系数的演变公式22222222 yynxxnyxxynynyxnxyxnxyr相关系数取值及其意义相关系数取值及其意义1、r 的取值范围是-1,12、|r|=1,为完全相关r=1,为完全正相关;r=-1,为完全负正相关3、r=0,不存在线性相关关系相关4、-1r0,为负相关;0r1,为正相关5、|r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切w 1、双胞胎身高间的相关系数是r=0.95w 2、美国2534岁男子收入与受教育程度r=0.34 美国5564岁男子收入与受教育程度 r=0.44生活中的相关:生活中的相关:两点注意两点注意w 1、r=0只表明

    8、不存在线性相关,而不能说明是否存在非线性相关(亦即:r=0 时可能存在曲线相关)。w 2、r值仅表明两变量相关程度,不表明因果关系。例:美国1874岁男子身高与体重之间的相关系数约为0.54,以下说法正确的是:(1)较高的男子趋于较重(2)体重较重的男子趋于较高(3)体重与身高之间的相关系数为0.54(4)如果多吃一些从而增加体重,你的身材就会变高。表:表:我国人均国民收入与人均消费金额数据我国人均国民收入与人均消费金额数据 单位单位:元元年份年份人均人均国民收入国民收入x人均人均消费金额消费金额y年份年份人均人均国民收入国民收入人均人均消费金额消费金额19811982198319841985

    9、19861987393.8419.14460.86544.11668.29737.73859.972492672893294064515131988198919901991199219931068.81169.21250.71429.51725.92099.56436907138039471148相关系数算例相关系数算例w根据样本相关系数的计算公式有 w人均国民收入与人均消费金额之间的相关系数为 0.9987上面介绍的是简单相关系数,其次还有复相关系数,偏相关系数和等级相关系数等。(偏相关系数与复相关系数见课本第115页)等级相关系数等级相关系数有些变量无法用数量定大小,只能以等级排序。如才智

    10、高低、事态轻重、色泽深浅、效率大小、味道好坏等。斯皮尔曼等级相关系数)1(6122nndrs例:确定学校名气和毕业生表现业例:确定学校名气和毕业生表现业绩之间是否存在相关联?绩之间是否存在相关联?学校12345678910学校名气10791623854毕业生表现排名83729451061差距(d)242-1-3-2-2-2-13差距平方(d2)41641944419四、相关系数的显著性检验四、相关系数的显著性检验样本数据(样本数据(r值)表明两个变量存在相关关系,值)表明两个变量存在相关关系,是否能说明总体变量也存在相关关系?是否能说明总体变量也存在相关关系?检验步骤1、提出假设:H0:;H1

    11、:02、计算检验统计量3、相关系数的显著性检验相关系数的显著性检验(实例)(实例)对前例计算的相关系数进行显著性检(0.05)1、提出假设:H0:;H1:02、计算检验的统计量第二节第二节 简单回归分析简单回归分析回归分析的内容回归分析的内容回归模型和回归方程回归模型和回归方程简单线性回归(一元线性回归方简单线性回归(一元线性回归方 程)的建程)的建立(拟合)立(拟合)线性回归方程拟合优度的测定线性回归方程拟合优度的测定回归方程的显著性检验回归方程的显著性检验回归预测回归预测回归方法描述一个变量如何地依赖另一个变量。身高和体重;成绩与努力程度;工作好坏与实力、机遇等“回归”一词来源于生物学。英

    12、国生物统计学家高尔顿根据1078对父子身高的散点图发现,虽然身材高的父母比身材矮的父母倾向于有高的孩子,但平均而言,父母身材高的其子要矮些,而身材矮小的,其子要高些。这种遗传上身高趋于一般,“退化到平庸”的现象,高尔顿称作回归。高尔顿的学生皮尔逊继续研究,把回归的概念和高尔顿的学生皮尔逊继续研究,把回归的概念和数学方法联系起来,把代表现象之间一般数量关数学方法联系起来,把代表现象之间一般数量关系的直线或曲线称为回归直线或回归曲线。系的直线或曲线称为回归直线或回归曲线。回归:借用的遗传学概念,现指变量之间的一般数量关系。回归分析:用函数关系近似表达现象之间数量变化的一般规律。反映现象间相关关系数

    13、量变化规律的函数表达式称为回归模型或方程。回归分析的特点w两个变量不是对等的,必须区分自变量和因变量w回归方程是用来由自变量的给定值来推算因变量数值的。自变量一般是给定的,因变量是随机的。w回归分析是相关分析的目的回归分析与相关分析的区别回归分析与相关分析的区别(见课本(见课本113页)页)1、相关分析中,变量 x 变量 y 处于平等的地位;回归分析中,变量 y 称为因变量(dependent variable),处在被解释的地位,x 称为自变量(independent variable),用于预测因变量的变化2、相关分析中所涉及的变量 x 和 y 都是随机变量;回归分析中,因变量 y 是随机

    14、变量,自变量 x 可以是随机变量,也可以是非随机的确定变量3、相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制 一、回归分析的内容一、回归分析的内容1、简单线性回归方程的拟合。从一组样本数据出发,确定变量之间的数学关系式2、拟合优度的测定及回归方程的显著性检验。对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著3、回归预测。利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度二、回归模型和回归方程二、

    15、回归模型和回归方程回归模型回归模型多元回归多元回归一元回归一元回归线性线性回归回归非线性非线性回归回归线性线性回归回归非线性非线性回归回归回归模型的类型回归模型回归模型1、回答“变量之间是什么样的关系?”2、方程中运用1 个数字的因变量(响应变量)被预测的变量1 个或多个数字的或分类的自变量(解释变量)用于预测的变量3、主要用于预测和估计一元线性回归模型一元线性回归模型(概念要点(概念要点)1、当只涉及一个自变量时称为一元回归,若因变量 y 与自变量 x 之间为线性关系时称为一元线性回归2、对于具有线性关系的两个变量,可以用一条线性方程来表示它们之间的关系3、描述因变量 y 如何依赖于自变量

    16、x 和误差项 的方程称为回归模型一元线性回归模型一元线性回归模型(概念要点(概念要点)对于只涉及一个自变量的简单线性回归模型可表示为 模型中,y 是 x 的线性函数(部分)加上误差项线性部分反映了由于 x 的变化而引起的 y 的变化误差项 是随机变量反映了除 x 和 y 之间的线性关系之外的随机因素对 y 的影响是不能由 x 和 y 之间的线性关系所解释的变异性0 和 1 称为模型的参数bxay一元线性回归模型一元线性回归模型(基本假定)(基本假定)1、误差项是一个期望值为0的随机变量,即E()=0。对于一个给定的 x 值,y 的期望值为 E(y)=a+b x2、对于所有的 x 值,的方差2

    17、都相同3、误差项是一个服从正态分布的随机变量,且相互独立。即N(0,2)独立性意味着对于一个特定的 x 值,它所对应的与其他 x 值所对应的不相关对于一个特定的 x 值,它所对应的 y 值与其他 x 所对应的 y 值也不相关回归方程回归方程(概念要点)(概念要点)1、描述 y 的平均值或期望值如何依赖于 x 的方程称为回归方程回归方程2、简单线性回归方程的形式如下 E(y)=a+b x三、简单线性回归(一元线三、简单线性回归(一元线性回归方性回归方 程)的建立(拟合)程)的建立(拟合)一元一元回归方程建立的前提条件回归方程建立的前提条件1、r 的绝对值大于0.6 2、有线性关系最小二乘法估计最

    18、小二乘法估计最小二乘法最小二乘法(图示)(图示)最小二乘法最小二乘法(公式推导见课本(公式推导见课本359页)页)(和和 的计算公式的计算公式)a ba b1112211nnniiiiiiinniiiinx yxybnxxaybx估计方程的求法估计方程的求法(实例)(实例)w 例:根据前例中的数据,配合人均消费金额对人均国民收入的回归方程w 根据 求解公式得估计方程估计方程w 人均消费金额y对人均国民收入x的回归方程为05001000150005001000150020002500人均消费与人均国民收入的回归人均消费与人均国民收入的回归估计方程的求法估计方程的求法(Excel的输出结果)的输出

    19、结果)SUMMARY OUTPUTSUMMARY OUTPUT回归统计回归统计Multiple RMultiple R0.9987038210.998703821R SquareR Square0.9974093220.997409322Adjusted R SquareAdjusted R Square0.9971738060.997173806标准误差标准误差14.9496776614.94967766观测值观测值13 13CoefficientsCoefficients标准误差标准误差t Statt StatP-valueP-valueLower 95%Lower 95%Upper 95

    20、%Upper 95%InterceptIntercept54.2228639254.22286392 8.993978698.99397869 6.0287966.0287968.56501E-058.56501E-05 34.427240334.4272403 74.018487574.0184875X Variable 1X Variable 10.526377140.52637714 0.008088550.00808855 65.0768265.076821.39842E-151.39842E-15 0.508574350.50857435 0.544179930.54417993ni

    21、iyxxSntb122)()2(niiyxxxnSnta1222)()(1)2(四、线性回归方程拟合优度的测定四、线性回归方程拟合优度的测定(判定系数、估计标准误差)判定系数、估计标准误差)1、因变量 y 的取值是不同的,y 取值的这种波动称为变差。变差来源于两个方面由于自变量 x 的取值不同造成的除 x 以外的其他因素(如x对y的非线性影响、测量误差等)的影响2、对一个具体的观测值来说,变差的大小可以通过该实际观测值与其均值之差 来表示总变差的分解离差平方和的分解离差平方和的分解(图示)(图示)yyyyiyyiiiyy),(iiyxxbxay离差平方和的分解离差平方和的分解(三个平方(三个平

    22、方和的关系)和的关系)2、两端平方后求和有变差平方和的分解变差平方和的分解(三个平方和的意义)(三个平方和的意义)1、总平方和(SST)反映因变量的 n 个观察值与其均值的总离差2、回归平方和(SSR)反映自变量 x 的变化对因变量 y 取值变化的影响,或者说,是由于 x 与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和3、剩余平方和(SSE)反映除 x 以外的其他因素对 y 取值的影响,也称为不可解释的平方和2()yy2()yy2()yyxybyayyySSExxbyySSRynyyySST22222222)()()()(判定系数判定系数 r222121niiniiyySS

    23、RrSSTyy估计标准误差估计标准误差 Sy1、反映实际观察值在回归直线周围的分散状况2、从另一个角度说明了回归直线的拟合程度3、Sy越小,回归方程拟合得越好。相关和回归分析之间的联系相关和回归分析之间的联系w 相关系数r 和回归系数b的关系w 相关系数r与估计标准误差Sy的关系xyrb222222()()()()()()()xyxxyxyxxyybxxxxyyrxxyy 21 rSyy应用相关分析与回归分析应注意的问题应用相关分析与回归分析应注意的问题w1、定性分析与定量分析相结合w2、注意客观现象的数量界限w3、注意社会经济现象的复杂性w4、注意相关分析与回归分析的辨证关系五、回归分析的显

    24、著性检验五、回归分析的显著性检验 线性回归方程的显著性检验回归系数b的检验 相关系数的检验b回归方程的显著性检验回归方程的显著性检验(线性关系的检验(线性关系的检验)1、检验自变量和因变量之间的线性关系是否显著2、具体方法是将回归离差平方和(SSR)同剩余离差平方和(SSE)加以比较,应用F检验来分析二者之间的差别是否显著如果是显著的,两个变量之间存在线性关系如果不显著,两个变量之间不存在线性关系回归方程的显著性检验回归方程的显著性检验(检验的步骤)(检验的步骤)1、提出假设H0:线性关系不显著(方程不显著)回归方程的显著性检验回归方程的显著性检验(方差分析表)(方差分析表)方差分析方差分析d

    25、f dfSS SSMS MSF FSignificance FSignificance F回归回归1 1946491946491946491946491 4234.994234.991.39842E-151.39842E-15残差残差11 11 2458.422458.42 223.493223.493总计总计12 12948949948949回归系数的显著性检验回归系数的显著性检验回归系数的显著性检验回归系数的显著性检验(步骤)(步骤)1、提出假设bH0:b=0(没有线性关系)H1:b 0(有线性关系)2、计算检验的统计量回归系数的显著性检验回归系数的显著性检验(Excel输出的结果)输出的

    26、结果)00808855.052637714.0bbSbt99397869.822286392.54aaSatniiyaxxxnSS122)()(1niiybxxSS12)(一点注意一点注意四、回归预测四、回归预测w 回归方程通过显著性检验后,可以作回归预测。w 给定一x0值,可根据回归方程求得y0的估计值 ,现要按一定的概率推断总体中相应的因变量的可能数值。0 y2202/00)()(1)2(xxxxnSntyyy第三节第三节 多元线性回归多元线性回归多元线性回归模型多元线性回归模型回归参数的估计回归参数的估计回归方程的显著性检验回归方程的显著性检验回归系数的显著性检验回归系数的显著性检验多元

    27、线性回归的预测多元线性回归的预测多元线性回归模型多元线性回归模型(概念要点(概念要点)1.一个因变量与两个及两个以上自变量之间的回归2.描述因变量 y 如何依赖于自变量 x1,x2,xp 和误差项 的方程称为多元线性回归模型多元线性回归模型3.涉及 p 个自变量的多元线性回归模型可表示为多元线性回归模型多元线性回归模型(概念要点(概念要点)w 对于 n 组实际观察数据(yi;xi1,,xi2,xip),(i=1,2,n),多元线性回归模型可表示为多元线性回归模型多元线性回归模型(基本假定)(基本假定)1、自变量 x1,x2,xp是确定性变量,不是随机变量2、随机误差项的期望值为0,且方差2 都

    28、相同3、误差项是一个服从正态分布的随机变量,即N(0,2),且相互独立多元线性回归方程多元线性回归方程(概念要点)(概念要点)1、描述 y 的平均值或期望值如何依赖于 x1,x1,xp的方程称为多元线性回归方多元线性回归方程程2、多元线性回归方程的形式为 E(y)=0+1 x1+2 x2+p xp多元线性回归的估计多元线性回归的估计(经验经验)方程方程1、总体回归参数 是未知的,利用样本数据去估计一个二元线性回归的例子一个二元线性回归的例子销售额、人口数和年人均收入数据销售额、人口数和年人均收入数据地区地区编号编号销售额销售额(万元)(万元)y人口数人口数(万人万人)x1年年人均收入人均收入(

    29、元元)x21234567891033.335.527.630.431.953.135.629.035.134.532.429.126.331.229.240.729.823.028.226.91250165014501310131015801490152016201570一个二元线性回归的例子一个二元线性回归的例子(Excel 输出的结果输出的结果)SUMMARY OUTPUTSUMMARY OUTPUT回归统计回归统计Multiple RMultiple R0.9681590250.968159025R SquareR Square0.9373318970.937331897Adjusted

    30、 R SquareAdjusted R Square 0.9194267250.919426725标准误差标准误差2.0100502792.010050279观测值观测值1010方差分析方差分析dfdfSSSSMSMSF FSignificance FSignificance F回归分析回归分析2 2 423.01789423.01789 211.50894211.50894 52.3497852.349786.1612E-056.1612E-05残差残差7 7 28.28211528.282115 4.04030214.0403021总计总计9 9451.3451.3Coefficients

    31、Coefficients 标准误差标准误差t Statt StatP-valueP-valueLower 95%Lower 95%Upper 95%Upper 95%InterceptIntercept-38.8251694-38.8251694 8.47859118.4785911-4.579201-4.579201 0.0025460.002546-58.873837-58.873837-18.7765-18.7765X Variable 1X Variable 11.3406936181.340693618 0.14331590.1433159 9.35481479.3548147 3.31E-053.31E-051.001805621.001805621.6795821.679582X Variable 2X Variable 20.0228022930.022802293 0.00475420.0047542 4.79621724.7962172 0.0019750.0019750.011560350.011560350.0340440.03404411)1(122pnnRR调整1)(12pnyySniiy一个二元线性回归的例子一个二元线性回归的例子(计算机输出结果解释计算机输出结果解释)销售额与人口数和年人均收入的二元回归方程为

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:第七章相关分析和回归分析课件.ppt
    链接地址:https://www.163wenku.com/p-5177602.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库