一元线性回归方程概述课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《一元线性回归方程概述课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 一元 线性 回归 方程 概述 课件
- 资源描述:
-
1、o 回归的含义回归的含义o 一元回归模型的建立一元回归模型的建立o 参数估计参数估计最小二乘法最小二乘法o 随机误差项的古典假定随机误差项的古典假定o 最小二乘估计量的性质最小二乘估计量的性质o 最小二乘估计量的概率分布最小二乘估计量的概率分布o 回归系数的显著性检验与置信区间回归系数的显著性检验与置信区间o 用样本可决系数检验回归方程的拟合优度用样本可决系数检验回归方程的拟合优度o 案例分析案例分析第二章第二章 一元线性回归模型一元线性回归模型 回归概念的提出回归概念的提出l Francis Galton最先使用“回归(regression)”。l 父母高,子女也高;父母矮,子女也矮。给定父
2、母的身高,子女平均身高趋向于“回归”到 全体人口的平均身高。F.F.加尔顿是达尔文的表弟,是研究智力的先驱者之一,他非常严肃,加尔顿是达尔文的表弟,是研究智力的先驱者之一,他非常严肃,非常聪明,但也有些疯狂,他出生在一个贵格教徒家庭中,祖上是著名非常聪明,但也有些疯狂,他出生在一个贵格教徒家庭中,祖上是著名的和平主义者,有趣的是,他家的名下却有生产枪支的企业。高尔顿是的和平主义者,有趣的是,他家的名下却有生产枪支的企业。高尔顿是个申通,个申通,6 6岁便能阅读和背诵莎士比亚的作品,他在更小的时候已经会岁便能阅读和背诵莎士比亚的作品,他在更小的时候已经会说了希腊语和拉丁语。他似乎对什么事情都感兴
3、趣,成年后的高尔顿在说了希腊语和拉丁语。他似乎对什么事情都感兴趣,成年后的高尔顿在气象学、心理学、摄影学,甚至是刑事司法领域都有所建树(他倡导使气象学、心理学、摄影学,甚至是刑事司法领域都有所建树(他倡导使用指纹分析的科学方法来确定罪犯身份)。此外,他还发明了用指纹分析的科学方法来确定罪犯身份)。此外,他还发明了“标准差标准差”这一统计概念及线性回归法,并用这些数学工具来研究人类的行为。这一统计概念及线性回归法,并用这些数学工具来研究人类的行为。一、回归的含义一、回归的含义 回归的现代释义回归的现代释义回归分析回归分析用于研究一个变量关于另一个(些)变量的具用于研究一个变量关于另一个(些)变量
4、的具体依赖关系的计算方法和理论。体依赖关系的计算方法和理论。l商品需求函数:ntunemploymebainflation12)(TRbaTaxbPaQLKAQlnlnlnlnl生产函数:l菲利普斯曲线:l拉弗曲线:l 等式左边的变量被称为 被解释变量(被解释变量(explained variable)因变量因变量(dependent variable)响应变量(响应变量(response variable)被预测变量(被预测变量(predicted variable)回归子(回归子(regressand)回归的现代释义回归的现代释义l 等式右边的变量被称为 解释变量(解释变量(explana
5、tory variable)自变量(自变量(independent variable)控制变量(控制变量(control variable)预测变量(预测变量(predictor variable)回归元(回归元(regressor)。)。l在多数对经济理论的检验中(包括对公共政策的评价),经济在多数对经济理论的检验中(包括对公共政策的评价),经济学家的目标就是要退订一个变量(比如受教育程度)对另一个学家的目标就是要退订一个变量(比如受教育程度)对另一个变量(如犯罪率或工人的生产率)具有变量(如犯罪率或工人的生产率)具有因果效应因果效应(causal effect)。有时可能会很简单就能发现两
6、个或多个变量之间存)。有时可能会很简单就能发现两个或多个变量之间存在很强的联系,但除非能得到某种因果关系,否则这种联系很在很强的联系,但除非能得到某种因果关系,否则这种联系很难令人信服。难令人信服。l其他条件不变(其他条件不变(ceteris paribus):意味着:意味着“其他(相关因其他(相关因素保持不变)素保持不变)”的概念,它在因果分析中有重要的作用。的概念,它在因果分析中有重要的作用。l这个概念看似简单,但是除非在极为特殊的条件下,很难实现这个概念看似简单,但是除非在极为特殊的条件下,很难实现l多数经验研究中的一个关键问题是:要做出一个因果推断,是多数经验研究中的一个关键问题是:要
7、做出一个因果推断,是否能使其他足够多的因素保持不变呢?否能使其他足够多的因素保持不变呢?l只要方法得当,用计量经济方法可以模拟一个其他条件不变的只要方法得当,用计量经济方法可以模拟一个其他条件不变的实验实验通过对模型进行假定。通过对模型进行假定。回归分析中的回归分析中的因果关系因果关系和和其他条件不变其他条件不变的概念的概念二、一元线性回归模型二、一元线性回归模型 回归分析都是从如下假设前提开始的:回归分析都是从如下假设前提开始的:Y和和X是代表某个总是代表某个总体的变量,我们感兴趣的是体的变量,我们感兴趣的是“用用X解释解释Y”或或“研究研究Y如何随如何随X而变化而变化”在写出用在写出用X解
8、释解释Y的模型时,面临三个问题的模型时,面临三个问题o Y和和X的函数关系是怎么样的?的函数关系是怎么样的?o 如何考虑其他影响如何考虑其他影响Y的因素呢?的因素呢?o 我们如何才能确信我们得到的是,是在其他条件不变情况下我们如何才能确信我们得到的是,是在其他条件不变情况下的的Y和和X之间的关系?之间的关系?Y=0+1 X+u其中:其中:Y被解释变量;被解释变量;X解释变量;解释变量;u随机误差项;表示除随机误差项;表示除X之外其他影响之外其他影响Y的因素,一元回的因素,一元回 归分析归分析 将除将除X之外的其他所有影响之外的其他所有影响Y的因素都看成了无法观测的因素都看成了无法观测的因素的因
9、素 0,1回归系数(待定系数或待估参数)回归系数(待定系数或待估参数)1是斜率系数,是主要的研究对象是斜率系数,是主要的研究对象 0 是常数项,也被称作截距参数,很少被当做分析的核心是常数项,也被称作截距参数,很少被当做分析的核心我们可以通过建立一个如下的关于我们可以通过建立一个如下的关于Y Y和和X X的方程来解决上述三个问的方程来解决上述三个问题题总体回归模型总体回归模型 为解决上面提到的第三个问题,及如何在忽略其他因素的同时,为解决上面提到的第三个问题,及如何在忽略其他因素的同时,又得到其他因素不变情况下又得到其他因素不变情况下X对对Y的影响呢?这需要我们对无法观测的影响呢?这需要我们对
10、无法观测的的u和和X之间的关系加以约束,并且只有如此,才能从一个随机样本之间的关系加以约束,并且只有如此,才能从一个随机样本数据中获得数据中获得0和和1的可靠估计量。的可靠估计量。E(u)=0 即无法观测的因素的平均值为零,不会对结果产生影响即无法观测的因素的平均值为零,不会对结果产生影响 E(u|X)=0 根据根据X的不同把总体划分为若干部分,每个部分中无法的不同把总体划分为若干部分,每个部分中无法 观测的因素都具有想通的平均值,且这个共同的平均值观测的因素都具有想通的平均值,且这个共同的平均值 必然等于整个总体中必然等于整个总体中u的平均值,即的平均值,即u是均值独立的。是均值独立的。根据
11、上面的假定对原模型取期望得:根据上面的假定对原模型取期望得:E(Y|X)=E(0+1X+u)|XE(Y|Xi)=0+1X 总体回归函数总体回归函数E(Y|X)是是X的一的一个线性函数,它表示个线性函数,它表示Y中可以由中可以由X解释的部分解释的部分,线性意味着,线性意味着X变变化一个单位,化一个单位,Y的期望改变的期望改变1个个单位。对于任意给定的单位。对于任意给定的X值,值,Y的分布都是以的分布都是以E(Y|X)为中心的。为中心的。=0+1X+E(u|X)=0+1X总体回归函数总体回归函数(直线)(直线)XiYiY1Y2Y3u1u2u3e2e3e1E(Y|Xi)=0+1 XiiiXY10 通
12、常总体回归函数通常总体回归函数E(Y)=0+1X是观测不到的,利用样本得到的是是观测不到的,利用样本得到的是对它的估计,即对对它的估计,即对 0和和 1的估计。令的估计。令(Xi,Yi):i=1,n表示从总体中抽取表示从总体中抽取的一个样本容量为的一个样本容量为n的随机样本,对于每个的随机样本,对于每个i,可以写出:,可以写出:iiiuXY10其中ui是第i次观测的误差项(估计的)样本回归函数:(估计的)样本回归函数:(估计的)样本回归模型:(估计的)样本回归模型:iiieXY10iiXY10其中ei是第i次观测的残差对于所研究的经济问题,通常总体回归直线对于所研究的经济问题,通常总体回归直线
13、 E(Yi|Xi)=0+1Xi 是是观测不到的。可以通过收集样本来对总体(真实的)回归直线做出估计。观测不到的。可以通过收集样本来对总体(真实的)回归直线做出估计。样本回归模型:样本回归模型:iiXY10其中:其中:为为Yi的估计值(拟合值);的估计值(拟合值);iY10,为为 0,1 的估计值;的估计值;iiieXY10ei为残差,可视为为残差,可视为ui的估计值。的估计值。三、参数估计三、参数估计最小二乘法最小二乘法样本回归直线:样本回归直线:4060801001201401601802004080120160200240280XY如何得到一条能够较好地反映这些点变化规律的直线呢?如何得到
展开阅读全文