统计学原理相关与回归课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《统计学原理相关与回归课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 原理 相关 回归 课件
- 资源描述:
-
1、第九章第九章 相关与回归相关与回归相关和回归分析是研究事物的相互关系、相关和回归分析是研究事物的相互关系、测定它们联系的紧密程度、揭示其变化的测定它们联系的紧密程度、揭示其变化的具体形式和规律性的统计方法,是经济分具体形式和规律性的统计方法,是经济分析、预测和控制的重要工具。析、预测和控制的重要工具。第一节第一节 相关与回归分析的基本问题相关与回归分析的基本问题一、相关的概念与种类一、相关的概念与种类n函数关系函数关系现象之间确实存在数量上的相互依存关系。现象之间确实存在数量上的相互依存关系。表现在:一个现象发生数量上的变化,另表现在:一个现象发生数量上的变化,另一个与之相联系的现象也会相应地
2、发生数一个与之相联系的现象也会相应地发生数量上的变化。量上的变化。n相关关系相关关系现象之间数量上不确定、不严格的依存关现象之间数量上不确定、不严格的依存关系。相关关系的全称为统计相关关系,它系。相关关系的全称为统计相关关系,它属于变量之间的一种不完全确定的关系。属于变量之间的一种不完全确定的关系。出租汽车费用与行驶里程:出租汽车费用与行驶里程:总费用总费用=行驶里程行驶里程 每公里单价每公里单价PKG 家庭收入与恩格尔系数:家庭收入与恩格尔系数:家庭收入高,则恩格尔系数低。家庭收入高,则恩格尔系数低。相关关系相关关系n相关关系与函数关系的区别相关关系与函数关系的区别n函数关系是变量之间的一种
3、严格、完全确定性的关系,即一个变量的数值完全有另一个(或一组)变量的数值所决定、控制。函数关系通常可以用数学公式确切地表示出来。n相关关系难以像函数关系那样,用数学公式去准确表达。n相关关系与函数关系的联系相关关系与函数关系的联系n 由于客观上常会出现观察或测量上的误差由于客观上常会出现观察或测量上的误差等原因,函数关系在实际工作中往往通过相等原因,函数关系在实际工作中往往通过相关关系表现出来。当人们对某些现象内部规关关系表现出来。当人们对某些现象内部规律有较深刻认识时,相关关系可能变为函数律有较深刻认识时,相关关系可能变为函数关系。为此,在研究相关关系时,又常常使关系。为此,在研究相关关系时
4、,又常常使用函数关系作为工具,用一定的函数关系表用函数关系作为工具,用一定的函数关系表现相关关系的数量联系。现相关关系的数量联系。n相关关系的种类相关关系的种类根据相关关系的根据相关关系的程度划分程度划分 根据相关关系的方根据相关关系的方向划分向划分 根据自变量的多少根据自变量的多少划分划分 根据变量间相互关根据变量间相互关系的表现形式划分系的表现形式划分 不完全相关不完全相关 完全相关完全相关 不相关不相关 正相关正相关 负相关负相关 复相关复相关 单相关单相关 直线相关直线相关 曲线相关曲线相关 1、不相关。、不相关。如果变量间彼此的数量变化互相独立,则其关系为不相如果变量间彼此的数量变化
5、互相独立,则其关系为不相关。自变量关。自变量x变动时,因变量变动时,因变量y的数值不随之相应变动。例如,产品税的数值不随之相应变动。例如,产品税额的多少与工人的出勤率、家庭收入多少与孩子的多少之间都不存在额的多少与工人的出勤率、家庭收入多少与孩子的多少之间都不存在相关关系。相关关系。2、完全相关。、完全相关。如果一个变量的变化是由其他变量的数量变化所唯一如果一个变量的变化是由其他变量的数量变化所唯一确定,此时变量间的关系称为完全相关。即因变量确定,此时变量间的关系称为完全相关。即因变量y的数值完全随自的数值完全随自变量变量x的变动而变动,它在相关图上表现为所有的观察点都落在同一的变动而变动,它
6、在相关图上表现为所有的观察点都落在同一条直线上,这种情况下,相关关系实际上是函数关系。所以,函数关条直线上,这种情况下,相关关系实际上是函数关系。所以,函数关系是相关关系的一种特殊情况。系是相关关系的一种特殊情况。3、不完全相关。、不完全相关。如果变量间的关系介于不相关和完全相关之间,则如果变量间的关系介于不相关和完全相关之间,则称为不完全相关。如妇女的结婚年龄与受教育程度之间的一种关系。称为不完全相关。如妇女的结婚年龄与受教育程度之间的一种关系。大多数相关关系属于不完全相关,是统计研究的主要对象大多数相关关系属于不完全相关,是统计研究的主要对象根据相关关系的程度划根据相关关系的程度划分分1、
7、正相关。、正相关。指两个因素(或变量)之间的变化方向一致,指两个因素(或变量)之间的变化方向一致,都是呈增长或下降的趋势。即自变量都是呈增长或下降的趋势。即自变量x的值增加(或减的值增加(或减少),因变量少),因变量y的值也相应地增加(或减少),这样的关的值也相应地增加(或减少),这样的关系就是正相关。例如,工业总产值增加,企业税利总额也系就是正相关。例如,工业总产值增加,企业税利总额也随之增加;家庭消费支出随收入增加而增加等。随之增加;家庭消费支出随收入增加而增加等。2、负相关。、负相关。指两个因素或变量之间变化方向相反,即自指两个因素或变量之间变化方向相反,即自变量的数值增大(或减小),因
8、变量随之减小(或增大)。变量的数值增大(或减小),因变量随之减小(或增大)。如劳动生产率提高,产品成本降低;产品成本降低,企业如劳动生产率提高,产品成本降低;产品成本降低,企业利润增加等。利润增加等。根据相关关系的方向划分根据相关关系的方向划分1、单相关。、单相关。两个因素之间的相关关系叫单相关,两个因素之间的相关关系叫单相关,即研究时只涉及一个自变量和一个因变量。即研究时只涉及一个自变量和一个因变量。2、复相关。、复相关。三个或三个以上因素的相关关系叫三个或三个以上因素的相关关系叫复相关,即研究时涉及两个或两个以上的自变复相关,即研究时涉及两个或两个以上的自变量和因变量。量和因变量。根据自变
9、量的多少划分根据自变量的多少划分1、直线相关(或线性相关)。、直线相关(或线性相关)。当相关关系的自变量当相关关系的自变量x发生变发生变动,因变量动,因变量y值随之发生大致均等的变动,从图像上近似值随之发生大致均等的变动,从图像上近似地表现为直线形式,这种相关通称为直线(或线性)相关。地表现为直线形式,这种相关通称为直线(或线性)相关。例如,销售量与销售额之间就呈直线相关关系。例如,销售量与销售额之间就呈直线相关关系。2、曲线(或非线性)相关。、曲线(或非线性)相关。在两个相关现象中,自变量在两个相关现象中,自变量x值值发生变动,因变量发生变动,因变量y也随之发生变动,这种变动不是均等也随之发
10、生变动,这种变动不是均等的,在图像上的分布是各种不同的曲线形式,这种相关关的,在图像上的分布是各种不同的曲线形式,这种相关关系称为曲线(或非线性)相关。曲线相关在相关图上的分系称为曲线(或非线性)相关。曲线相关在相关图上的分布,表现为抛物线、双曲线、指数曲线等非直线形式。例布,表现为抛物线、双曲线、指数曲线等非直线形式。例如,从人的生命全过程看,年龄与医疗费支出呈非线性相如,从人的生命全过程看,年龄与医疗费支出呈非线性相关。关。根据变量间相互关系的表现形式划分根据变量间相互关系的表现形式划分二、回归的概念和种类二、回归的概念和种类n1.回归的概念回归的概念 源自遗传学源自遗传学 现代概念:研究
11、自变量与因变量之间关系现代概念:研究自变量与因变量之间关系,其目的在于根其目的在于根据已知自变量来估计和预测因变量的总平均值。据已知自变量来估计和预测因变量的总平均值。n2.回归的种类回归的种类 根据回归变量多少,分为一元回归方程和多元回归方程根据回归变量多少,分为一元回归方程和多元回归方程 根据回归是否线性,分为线性回归方程和非线性回归方根据回归是否线性,分为线性回归方程和非线性回归方程程 根据回归是否有滞后关系,分为自身回归方程和无自身根据回归是否有滞后关系,分为自身回归方程和无自身回归现象的方程。回归现象的方程。n3.相关分析与回归分析的区别相关分析与回归分析的区别 相关分析研究随机变量
12、之间相互依存关系的方向和密切相关分析研究随机变量之间相互依存关系的方向和密切程度。直线相关用程度。直线相关用相关系数相关系数,曲线相关用曲线相关用相关指数相关指数表示。表示。回归分析研究某一因变量与一个或多个自变量之间数据回归分析研究某一因变量与一个或多个自变量之间数据关系变动趋势的方法。用关系变动趋势的方法。用回归方程回归方程表示表示。相关分析研究的都是随机变量,不用区分因变量和自变相关分析研究的都是随机变量,不用区分因变量和自变量量 回归分析研究时,要定出因变量和自变量。其中,自变回归分析研究时,要定出因变量和自变量。其中,自变量是确定的普通变量量是确定的普通变量,因变量是随机变量。因变量
13、是随机变量。相关和回归是研究事务两个不可分割的方面。相关和回归是研究事务两个不可分割的方面。二者具有共同的研究对象,而且在具体应用时,常常必二者具有共同的研究对象,而且在具体应用时,常常必须互相补充。相关分析需要依靠回归分析来表明现象数须互相补充。相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度。只有当变量之间存在着表明现象数量变化的相关程度。只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有高度相关时,进行回归分析寻求其相关的具体形式才有意义。意义。认识现象之间相关
14、形式、方向、相关程度。认识现象之间相关形式、方向、相关程度。对经济现象进行推算和预测。对经济现象进行推算和预测。可用于补充缺少的资料。可用于补充缺少的资料。相关分析的主要内容相关分析的主要内容揭示现象之间是否存在相关关系。揭示现象之间是否存在相关关系。确定相关关系的表现形式。确定相关关系的表现形式。确定现象变量间相关关系的密切程度和方向。确定现象变量间相关关系的密切程度和方向。回归分析的主要内容回归分析的主要内容建立相关关系的回归方程。建立相关关系的回归方程。测定因变量的估计值与估计值的误差程度。测定因变量的估计值与估计值的误差程度。进行相关关系的定性分析进行相关关系的定性分析 确定回归方程确
15、定回归方程 计算相关系数或相关指数,对回归方程进行计算相关系数或相关指数,对回归方程进行显著性检验。显著性检验。利用回归方程式进行推算和预测利用回归方程式进行推算和预测 对推算和预测作出置信区间估计。对推算和预测作出置信区间估计。(一)直线相关分析的特点(一)直线相关分析的特点1.两个变量是对等关系两个变量是对等关系2.只能算出一个相关系数只能算出一个相关系数3.相关系数有正负号,表示正相关或负相关相关系数有正负号,表示正相关或负相关4.相关系数的计算对资料有一定要求,相关的两个变量必相关系数的计算对资料有一定要求,相关的两个变量必须都是随机的,这也反映对等关系。相关系数的计算须都是随机的,这
16、也反映对等关系。相关系数的计算与应用有其独立意义,可直接从给定资料计算,可不与应用有其独立意义,可直接从给定资料计算,可不经过回归分析。经过回归分析。(二)相关关系的判断(二)相关关系的判断1.定性判断法定性判断法这是从定性角度分析和判断现象之间是否这是从定性角度分析和判断现象之间是否具有相关关系,以及相关关系的类型。具有相关关系,以及相关关系的类型。这种分析和判断所依据的是对现象的了解这种分析和判断所依据的是对现象的了解和对有关的理论知识、专业知识的掌握,和对有关的理论知识、专业知识的掌握,以及一定的社会实践经验。以及一定的社会实践经验。相关表、相关图法相关表、相关图法在定性判断的基础上,把
17、具有相关关系的两个在定性判断的基础上,把具有相关关系的两个量的具体数值按照一定顺序平行排列在一张表量的具体数值按照一定顺序平行排列在一张表上,以观察它们之间的相互关系,这种表就称上,以观察它们之间的相互关系,这种表就称为为相关表相关表;把相关表上一一对应的具体数值在直角坐标系把相关表上一一对应的具体数值在直角坐标系中用点标出来而形成的散点图则称为中用点标出来而形成的散点图则称为相关图相关图。利用相关图和相关表,可以更直观、更形象地利用相关图和相关表,可以更直观、更形象地表现变量之间的相互关系。表现变量之间的相互关系。相关表:相关表:编号编号工龄长度工龄长度(年)(年)x日产量(件)日产量(件)
18、y编号编号工龄长度工龄长度(年)(年)x日产量日产量(件)(件)y123456789109101213141515171717100011001050130015001200125016001600180011121314151617181920181818202020212122221500170018001500175018501050185018001950 xy直线负相关直线正相关xy完全直线相关xy不相关xy相相 关关 图图2.2.定量测定相关系数定量测定相关系数(1)相关系数)相关系数说明直线相关条件下,两个现象说明直线相关条件下,两个现象之间相关关系密切程度的统计分析指标。之间相
19、关关系密切程度的统计分析指标。在计算相关系数之前,首先判定两个现象之间是否存在着在计算相关系数之前,首先判定两个现象之间是否存在着直线相关,否则计算出的相关系数就没有实际意义。直线相关,否则计算出的相关系数就没有实际意义。判定的一般方法是作图法。作图法是通过作散点图来判定判定的一般方法是作图法。作图法是通过作散点图来判定两个现象之间是否存在直线相关。两个现象之间是否存在直线相关。对两个变量之间线性相关程度的度量称为简单对两个变量之间线性相关程度的度量称为简单相关系数,用相关系数,用r 表示。而对于曲线相关来说,是表示。而对于曲线相关来说,是用相关指数来衡量其相关程度的。直线相关系数用相关指数来
20、衡量其相关程度的。直线相关系数也称也称皮尔逊相关系数皮尔逊相关系数。yxxyr2yx2xy协方差协方差变量变量x的标准差的标准差变量变量y的标准差的标准差nyynxxnyyxx2y2x2xy LLLxxxyryyxy22yx2yyxxyyxx负相关正相关0000rrLLxyxy3.相关系数相关系数r的意义的意义 相关系数的取值范围是:相关系数的取值范围是:1r1(r 1)r愈接近愈接近0,x与与y之间的直线相关程度愈小,之间的直线相关程度愈小,r 的值愈接近的值愈接近1,x与与y之间的相关程度愈高。之间的相关程度愈高。r 0表示两个变量之间不存在直线相关;表示两个变量之间不存在直线相关;r0.
21、3,表示极低度相关,表示极低度相关 0.3 r 0.5,表示低度相关,表示低度相关 0.5 r 0.8,表示中度相关,表示中度相关 r 0.8,表示高度相关,表示高度相关 r1表示存在着完全正相关;表示存在着完全正相关;r-1表示存在着完全负相关。表示存在着完全负相关。但需要注意的是,但需要注意的是,r只表示只表示x与与y的直线相关的直线相关密切程度密切程度。当。当r很小甚至等于很小甚至等于0时,并不一定时,并不一定表示表示x与与y之间就不存在其他类型的关系。变之间就不存在其他类型的关系。变量之间的非线性相关程度较大可能导致量之间的非线性相关程度较大可能导致r0,当当 r0或或r很小时,不能得
22、出变量无关的结论。很小时,不能得出变量无关的结论。对两个线性相关的变量对两个线性相关的变量x和和y,根据研究目,根据研究目的,确定出自便量和因变量,建立两个变量的,确定出自便量和因变量,建立两个变量间的线性回归方程,然后用回归方程赖测定间的线性回归方程,然后用回归方程赖测定因变量的发展趋势的分析过程。因变量的发展趋势的分析过程。n两个变量的地位不对等。分自变量和因变量两个变量的地位不对等。分自变量和因变量n因变量是随机变量,自变量为非随机变量,可因变量是随机变量,自变量为非随机变量,可以预先控制和给定。以预先控制和给定。n回归方程可据以利用自变量的给定值推算因变回归方程可据以利用自变量的给定值
23、推算因变量的相应值。量的相应值。n回归系数可正可负。正号说明正相关,负号说回归系数可正可负。正号说明正相关,负号说明负相关。明负相关。(一)简单直线回归分析的特点(一)简单直线回归分析的特点n1.简单直线回归方程又称一元线性回归方程。简单直线回归方程又称一元线性回归方程。它是根据成对的两种变量的数据,寻找一直线它是根据成对的两种变量的数据,寻找一直线方程代替两变量的变化趋势,根据自变量的变方程代替两变量的变化趋势,根据自变量的变动,来推算因变量发展趋势和水平的方法。它动,来推算因变量发展趋势和水平的方法。它是研究相互关联的两种经济现象数量变动依存是研究相互关联的两种经济现象数量变动依存关系的一
24、种方法。关系的一种方法。(二)简单直线回归方程的确定(二)简单直线回归方程的确定 当两变量当两变量x、y 之间存在直线相关关系时,可以用之间存在直线相关关系时,可以用直线方程直线方程 近似代替近似代替x与与y的关系。的关系。方程中的参数方程中的参数a是回归直线的起点值,表现为当时是回归直线的起点值,表现为当时回归直线的回归直线的y坐标,即坐标,即y轴上的一个点,数学上叫轴上的一个点,数学上叫截距。截距。参数参数b 是回归直线的斜率,即回归系数。它代表是回归直线的斜率,即回归系数。它代表自变量自变量x每增加一个单位时,因变量每增加一个单位时,因变量y的平均增加的平均增加值。值。a和和b 数值确定
25、了,直线回归方程也就确定了。数值确定了,直线回归方程也就确定了。确定确定a、b的数值可用最小平方法。的数值可用最小平方法。bxaybxay最小平方法最小平方法基本数学要求:基本数学要求:2()m inyy02012min,min)(22xbxaybxaybabxayyy,有求偏导数,并令其为零、分别对函数中,有由xbynxbnyaxxnyxxynb22)(进一步整理,有:进一步整理,有:2ynab xxya xb x (三)(三)相关性的相关性的显著性检验显著性检验R检验步骤:检验步骤:(1)计算相关系数计算相关系数R;(2)根据回归模型的自由度()根据回归模型的自由度(n-m)和给定显)和给
展开阅读全文