第三章回归分析预测方法-课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第三章回归分析预测方法-课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第三 章回 分析 预测 方法 课件
- 资源描述:
-
1、 第三章第三章 回归分析预测方法回归分析预测方法5 非线性非线性回归预测法回归预测法1 引言引言2 一元线性一元线性回归预测法回归预测法3 多元线性多元线性回归预测法回归预测法4 虚拟变量虚拟变量 回归预测回归预测要求掌握以下内容:要求掌握以下内容:概念部分:概念部分:n1.1.变量之间的关系可以分成哪两类变量之间的关系可以分成哪两类 n2.2.回归分析与相关分析的区别和联系回归分析与相关分析的区别和联系n3.3.一元线性回归(一元线性回归(Linear regressionLinear regression)n4.4.最小二乘回归法的基本思想最小二乘回归法的基本思想n5.5.回归方程的显著性
2、检验回归方程的显著性检验n6.6.区间估计区间估计n7.7.虚拟变量虚拟变量计算部分:计算部分:n8.8.一元线性回归预测法一元线性回归预测法 第一节第一节 引言引言本章学习目的与要求:本章学习目的与要求:通过本章的学习,了解回归分析预测法通过本章的学习,了解回归分析预测法的概念,掌握回归分析中各系数的计算方法的概念,掌握回归分析中各系数的计算方法及回归预测方法,能够运用及回归预测方法,能够运用ExcelExcel工具来进行工具来进行预测。预测。回本章目录 案例:案例:n 有有2020户家庭,冬天户家庭,冬天的取暖费用与的取暖费用与3 3个因素个因素有关:日间户外的平均有关:日间户外的平均温度
3、,阁楼绝缘层的厚温度,阁楼绝缘层的厚度,以及炉子的使用年度,以及炉子的使用年数。如果某一家庭的平数。如果某一家庭的平均户外温度是均户外温度是F30F30度,度,阁楼绝缘层的厚度为阁楼绝缘层的厚度为5 5英寸,炉子已使用过英寸,炉子已使用过1010年,它的冬天取暖费用年,它的冬天取暖费用为多少?为多少?一、回归与回归分析预测方法一、回归与回归分析预测方法 “回归回归”一词的涵义一词的涵义n “回归回归”最初是遗传学中的一个名词,由英国最初是遗传学中的一个名词,由英国生物学家兼统计学家高尔登首先提出。他在研究生物学家兼统计学家高尔登首先提出。他在研究人类的身高时,发现子女身高有回归于人类的平人类的
4、身高时,发现子女身高有回归于人类的平均身高的趋势。均身高的趋势。n回归现代涵义回归现代涵义研究自变量与因变量之间的关系形式的分析方法。研究自变量与因变量之间的关系形式的分析方法。目的:根据已知自变量来估计和预测因变量的值。目的:根据已知自变量来估计和预测因变量的值。例如:例如:农作物亩产量农作物亩产量施肥量施肥量降雨量降雨量气温气温n 在研究某一社会经济现象的发展变化在研究某一社会经济现象的发展变化规律时,经过分析可以找到影响这一现规律时,经过分析可以找到影响这一现象变化的原因。在回归分析中,把某一象变化的原因。在回归分析中,把某一现象称为现象称为因变量因变量,它是预测的对象,把,它是预测的对
5、象,把引起这一现象变化的因素称为引起这一现象变化的因素称为自变量自变量,它是引起这一现象变化的原因。而因变它是引起这一现象变化的原因。而因变量则反映了自变量变化的结果。量则反映了自变量变化的结果。n 回归分析预测方法回归分析预测方法就是从各种经济就是从各种经济现象之间的相互关系出发,通过对与预现象之间的相互关系出发,通过对与预测对象有联系的现象变动趋势的分析,测对象有联系的现象变动趋势的分析,推算预测对象未来状态数量表现的一种推算预测对象未来状态数量表现的一种预测方法。预测方法。二、回归分析和相关分析二、回归分析和相关分析n1、变量之间的关系、变量之间的关系n 现实世界中,每一事物都与它周围的
6、事现实世界中,每一事物都与它周围的事物相互联系、相互影响,反映客观事物运动物相互联系、相互影响,反映客观事物运动的各种变量之间也就存在着一定的关系。变的各种变量之间也就存在着一定的关系。变量之间的关系可以分成两类:量之间的关系可以分成两类:函数关系函数关系和和相相关关系。关关系。(1 1)函数关系)函数关系。函数关系反映客观事物之。函数关系反映客观事物之间存在着严格的依存关系,是一种间存在着严格的依存关系,是一种确定确定性关系,性关系,亦即当其它条件不变时,对于亦即当其它条件不变时,对于某一自变量或几个自变量的每一数值,某一自变量或几个自变量的每一数值,都有因变量的一个的确定值与之相对应,都有
7、因变量的一个的确定值与之相对应,并且这种关系可以用一个确定的数学表并且这种关系可以用一个确定的数学表达式反映出来。达式反映出来。n设有两个变量设有两个变量x和和y,y与与x一起变化并完全依一起变化并完全依赖于赖于x,当,当x取某个数值时,取某个数值时,y依确定的关系取依确定的关系取相应的值,则称相应的值,则称y是是x的函数,记作的函数,记作y=f(x)。n如,企业的原材料消耗金额如,企业的原材料消耗金额y与产量与产量x1、单位、单位产量消耗产量消耗x2、原材料价格、原材料价格x3之间的关系可表示之间的关系可表示为为y=x1x2x3。例:圆面积对于半径的依存关。例:圆面积对于半径的依存关系,正方
8、形的面积对于边长的依存关系等等。系,正方形的面积对于边长的依存关系等等。n变量间的函数关系是一一对应的确定关系。变量间的函数关系是一一对应的确定关系。(2)相关关系)相关关系n相关关系相关关系。反映事物之间的非严格、不确定的线性依存。反映事物之间的非严格、不确定的线性依存关系。关系。有两个显著的特点:有两个显著的特点:事物之间在数量上确实存在一定的内在联系。表现在一事物之间在数量上确实存在一定的内在联系。表现在一个变量发生数量上的变化,要影响另一个变量也相应地个变量发生数量上的变化,要影响另一个变量也相应地发生数量上的变化。发生数量上的变化。例:例:事物之间的数量依存关系不是确定的,具有一定的
9、随机事物之间的数量依存关系不是确定的,具有一定的随机性。表现在给定自变量一个数值,因变量会有若干个数性。表现在给定自变量一个数值,因变量会有若干个数值和它对应,并且因变量总是遵循一定规律围绕这些数值和它对应,并且因变量总是遵循一定规律围绕这些数值平均数上下波动。其原因是影响因变量发生变化的因值平均数上下波动。其原因是影响因变量发生变化的因素不止一个。素不止一个。例例:影响:影响工业总产值工业总产值的因素除了的因素除了职工数职工数外,还有固定外,还有固定资产资产原值原值、流动资金流动资金和和能耗能耗等因素。等因素。成本成本劳动生产率劳动生产率n相关关系的特点相关关系的特点 1 1变量间关系不能用
10、函数关系精确表达。变量间关系不能用函数关系精确表达。2 2一个变量的取值不能由另一个变量唯一确定。一个变量的取值不能由另一个变量唯一确定。3 3对于线性相关,各观测点分布在直线周围。对于线性相关,各观测点分布在直线周围。-3-2-1012-2-1012(a)xy-2-1012-2-1012(b)xy-2-1012-2-1012(c)xy-3-2-1012302468(d)xy-3-2-1012-2-1012(a)xy-2-1012-2-1012(b)xy-2-1012-2-1012(c)xy-3-2-1012302468(d)xy不相关正相关负相关相 关 但 无线性关系2、回归分析与相关分析、
11、回归分析与相关分析研究和测度两个或两个以上变量之间关系的方研究和测度两个或两个以上变量之间关系的方法有法有回归分析回归分析和和相关分析相关分析。n相关分析相关分析。研究两个或两个以上随机变量之。研究两个或两个以上随机变量之间线性依存关系的紧密程度。通常用相关系间线性依存关系的紧密程度。通常用相关系数表示,多元相关时用复相关系数表示。数表示,多元相关时用复相关系数表示。n回归分析回归分析。研究某一随机变量(因变量)与。研究某一随机变量(因变量)与其他一个或几个普通变量(自变量)之间的其他一个或几个普通变量(自变量)之间的数量变动的关系。数量变动的关系。区区别别相关分析相关分析研究变量都是随机变量
12、,不分自变量与因变量研究变量都是随机变量,不分自变量与因变量回归分析回归分析明确的自变量和因变量,自变量是确定的普通变量,明确的自变量和因变量,自变量是确定的普通变量,因变量是随机变量。因变量是随机变量。联联系系相关分析相关分析事物之间相互依存关系的两个不可分割的方面。在事物之间相互依存关系的两个不可分割的方面。在实际工作中,一般先进行相关分析,由相关系数的实际工作中,一般先进行相关分析,由相关系数的大小决定是否需要进行回归分析。在相关分析的基大小决定是否需要进行回归分析。在相关分析的基础上建立回归模型,以便进行推算、预测。础上建立回归模型,以便进行推算、预测。回归分析回归分析 n相关分析相关
13、分析相关关系线性相关非线性相关完全相关(R=1)(即线性相关)不相关(R=0)正相关负相关正相关负相关n相关系数相关系数对变量之间关系密切程度的度量对变量之间关系密切程度的度量 n 的取值范围是的取值范围是 -1,1:-1,1:完全相关完全相关 /完全正相关完全正相关 /完全负相关完全负相关 /不存在线性相关关不存在线性相关关系系 /负相关负相关 /正相关正相关 一般,一般,r r0.70.7为高度相关;为高度相关;r r0.30.3为低度相关;为低度相关;0.30.3 r r0.70.7 为中度相关。为中度相关。r r222)()(*)()(iiiiiyyxxyyxxn相关系数的缺点:相关系
14、数的缺点:r r接近于接近于1 1的程度与的程度与n n有有关。当关。当n n较小时较小时r r的波动较大,当的波动较大,当n n较大时较大时r r的绝对值容易偏小。例如,的绝对值容易偏小。例如,n=2n=2时,时,r r的的绝对值总为绝对值总为1 1(两点连线总为一条直线)(两点连线总为一条直线)。n例例3-13-1 设有设有1010个厂家的投入和产出如下,根据这些数据,我个厂家的投入和产出如下,根据这些数据,我们可以认为投入和产出之间存在相关性吗?们可以认为投入和产出之间存在相关性吗?(相关数据)(相关数据)厂家12345678910投入20402030101020202030产出3060
15、4060304040503070n 回归分析回归分析是研究某一随机变量是研究某一随机变量(因变量因变量)与其与其他一个或几个普通变量他一个或几个普通变量(自变量自变量)之间的数量变之间的数量变动的关系。其动的关系。其基本思路基本思路是:从一组样本数据出是:从一组样本数据出发,确定变量之间的数学关系式,对这些关系发,确定变量之间的数学关系式,对这些关系式的可信程度进行各种统计检验,并从影响某式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著。然后利用所求的关系式,显著,哪些不显著。然后利用所求的关系式,根据一个
16、或几个变量的取值来预测或控制另一根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的个特定变量的取值,并给出这种预测或控制的精确程度。精确程度。3 3、回归分析的基本思路、回归分析的基本思路三、回归模型的种类三、回归模型的种类n (1)(1)根据根据自变量自变量的多少,回归模型可以分为一元回归模的多少,回归模型可以分为一元回归模型和多元回归模型。型和多元回归模型。n (2)(2)根据模型中自变量与因变量之间根据模型中自变量与因变量之间是否线性是否线性,可以分,可以分为线性回归模型和非线性回归模型。为线性回归模型和非线性回归模型。n (3)(3)根据回归模型是否带有根
17、据回归模型是否带有虚拟变量虚拟变量,回归模型可以分,回归模型可以分为普通回归模型和带虚拟变量的回归模型。为普通回归模型和带虚拟变量的回归模型。应用回归分析预测需满足条件:应用回归分析预测需满足条件:1.数据量不能太少(以多于数据量不能太少(以多于20个较好);个较好);2.预测对象与影响因素之间必须存在相关关系;预测对象与影响因素之间必须存在相关关系;第二节第二节 一元线性回归预测法一元线性回归预测法n 一元线性回归(一元线性回归(Linear regressionLinear regression)是指成对的两个是指成对的两个变量数据分布大体上呈直线趋势时,运用合适的参数估变量数据分布大体上
18、呈直线趋势时,运用合适的参数估计方法,求出一元线性回归模型,然后根据自变量与因计方法,求出一元线性回归模型,然后根据自变量与因变量之间的关系,预测因变量的趋势。变量之间的关系,预测因变量的趋势。n 现实中,很多社会经济现象之间都存在相关关系,现实中,很多社会经济现象之间都存在相关关系,因此,一元线性回归预测有很广泛的应用。进行一元线因此,一元线性回归预测有很广泛的应用。进行一元线性回归预测时,必须选用合适的统计方法估计模型参数,性回归预测时,必须选用合适的统计方法估计模型参数,并对模型及其参数进行统计检验。并对模型及其参数进行统计检验。回本章目录一、一元线性回归模型一、一元线性回归模型n一元线
19、性回归(一元线性回归(Linear regression),),只研究一个只研究一个自变量与一个因变量之间的统计关系。自变量与一个因变量之间的统计关系。n对于只涉及一个自变量的简单线性回归模型可表对于只涉及一个自变量的简单线性回归模型可表示为:示为:n其中,其中,b b0 0和和b b1 1称为模型的参数;称为模型的参数;e e是随机误差项,是随机误差项,又称随机干扰项,有又称随机干扰项,有 01yxbbe20,Ne在线性回归模型中加入随机误差项是基于在线性回归模型中加入随机误差项是基于以下原因:以下原因:n 第一,模型不可能包含所有的解释变量。第一,模型不可能包含所有的解释变量。n 第二,模
20、型的设定误差。第二,模型的设定误差。n 第三,测量误差的影响。第三,测量误差的影响。n 第四,其他随机因素的影响。第四,其他随机因素的影响。n简单线性回归方程简单线性回归方程的形式为的形式为 也称为也称为直线回归方程直线回归方程。其中,。其中,b b0 0是回归直线在是回归直线在y y轴上的截距;轴上的截距;b b1 1是直线的斜率,称为回归系数,表示当是直线的斜率,称为回归系数,表示当x x每变动一个单位每变动一个单位时,时,y y的平均变动值。的平均变动值。n总体回归参数总体回归参数b b0 0和和b b1 1是未知的,必需利用样本数据去估计。是未知的,必需利用样本数据去估计。用样本统计量
21、用样本统计量b b0 0和和b b1 1代替回归方程中的未知参数代替回归方程中的未知参数b b0 0和和b b1 1 ,就得到了估计的回归方程:就得到了估计的回归方程:n其中,其中,b b0 0是估计的回归直线在是估计的回归直线在y y轴上的截距,轴上的截距,b b1 1是直线的是直线的斜率。斜率。01,yxbbe01 ybb x二、参数二、参数b b0 0和和b b1 1的最小二乘估计的最小二乘估计n对对例例3-1中中两个变量的数据进行线性回归,两个变量的数据进行线性回归,就是要找到一条直线来适当地代表图中的那就是要找到一条直线来适当地代表图中的那些点的趋势。些点的趋势。n用数据寻找一条直线
22、的过程也叫做拟合用数据寻找一条直线的过程也叫做拟合一条直线。一条直线。02004006008001000120019921993 19941995 19961997 19981999 20002001 20022003 20042005利润额yt系列2线性(利润额yt)?22yab x 11yab x 33yab x n首先需要确定选择这条直线的标准。这里介首先需要确定选择这条直线的标准。这里介绍绍最小二乘回归法最小二乘回归法(least squares regressionleast squares regression)。)。n最小二乘回归法的基本思想:最小二乘回归法的基本思想:通过数学模
23、型,通过数学模型,拟合一条较为理想的直线,这条直线必须满拟合一条较为理想的直线,这条直线必须满足两点要求足两点要求(1 1)原数列的观测值与模型估计)原数列的观测值与模型估计值的离差平方和(值的离差平方和(即所有点到该直线的垂直即所有点到该直线的垂直距离的平方和)为最小。(距离的平方和)为最小。(2 2)原数列的观测)原数列的观测值与模型估计值的离差总和为值与模型估计值的离差总和为0 0。最小二乘法最小二乘法n离差与离差平方离差与离差平方eettteyy离差:11()0nnttttteyy离差和:2211()nnitttteyy离差平方和最小最小拟合程度最好拟合程度最好6y6 y最小二乘原理n
24、简单讲,使历史数据到拟合直线上的离差平方和最小,从而求得模型参数的方法。n法国数学家勒让德于1806年首次发表最小二乘理论。事实上,德国的高斯于1794年已经应用这一理论推算了谷神星的轨道,但迟至1809年才正式发表。n最小二乘法也是数理统计中一种常用的方法,在工业技术和其他科学研究中有广泛应用。n设简单线性回归模型设简单线性回归模型 中,中,b b0 0和和b b1 1是是b b0 0和和b b1 1的估计值。则的估计值。则y y的估计值用的估计值用 表示。表示。n我们要求出这样的待估参数我们要求出这样的待估参数b b0 0和和b b1 1,使因变量的观察值与估使因变量的观察值与估计值之间的
25、离差平方和达到最小,即使计值之间的离差平方和达到最小,即使 极小。为此,分别极小。为此,分别求求Q Q对对b b0 0和和b b1 1的偏导,就可以求出符合要求的待估参数的偏导,就可以求出符合要求的待估参数b b0 0和和b b1 1:01 ybb x01yxbbe22201iiiQyyybb xe10122,()nxyxyyxbbbnxxnn 例例3-2:已知某种商品的:已知某种商品的销售量销售量同居民的同居民的可支配可支配收入收入有关,现有如下表的统计数据,试建立回归有关,现有如下表的统计数据,试建立回归方程,并求出相应参数的最小二乘估计值。方程,并求出相应参数的最小二乘估计值。年份年份实
展开阅读全文