计量经济学课件南开大学经济学院张伯伟.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《计量经济学课件南开大学经济学院张伯伟.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计量 经济学 课件 南开大学 经济学院 张伯伟
- 资源描述:
-
1、引 言一、计量经济学1、计量经济学(Econometrics) 利用数学和统计推断为工具,在经济理论指导下对经济现象进行分析,并对经济理论进行检验和发展的一门学科。 其内容涉及经济理论、数理经济、经济统计和数理统计等。2、计量经济学与经济理论 经济理论:定性 计量经济学:数值估计,检验3、计量经济学与数理经济学 数理经济学:以数学形式表述经济理论,不涉及理论的可度量性和经验方面的可论证性。 计量经济学:利用数理经济学的数学方程式,并把之改造成适合于经验检验的形式。4、计量经济学与经济统计学 经济统计:经济数据的收集、加工,不利用数据来检验经济理论。 计量经济学:以经济统计数据为原始资料进行分析
2、。5、计量经济学与数理统计 数理统计:是计量经济学的基本工具,但由于经济数据的特殊性,力量经济学需要特殊的处理方法。二、计量经济学的方法基本过程: 经济理论 理论的数学模型 理论的计量经济学模型 数据的收集整理 计量经济模型的参数估计 假设检验 预报和预测 控制或政策制定例:例:检验凯恩斯关于边际消费倾向理论,或利用该理论进行经济控制或经济政策制定。理论 人们的消费支出随收入的增加而增加,但消费支出的增加小于收入的增加。即边际消费倾向MPC大于零而小于1。(定性)建立数学模型 假定消费支出Y与收入X之间有如下关系:10,XbXaY其中,Y为消费支出,X为收入,a和b为模型参数。B就是MPC。
3、这里Y为因变量,X为自变量/解释变量。假定两者之间存在先行关系。 (在不同情况下,数学模型的形式不一样,也可能是多个方程连立,有多个解释变量)建立计量经济学模型 由于经济变量之间的关系不是确定的(以函数形式准确表达),必须修改数理模型,建立计量模型: u为误差项,代表了影响变量间非确定关系的其他因素的影响。这是一个线性回归模型。ubXaYOXY斜率为b数理模型OXY斜率为b计量模型aa数据的收集整理 如果1980分析一国的消费情况,要收集该国的总消费支出数据和总收入数据。 (选择、加工)美国1980-1991年个人消费支出与GDP(10亿美元,1987年不变价格)计量经济模型的参数估计 采用回
4、归技术,利用统计数据估计出参数a和b的经验值。 根据估计结果,美国1980-1991年的MPC约为0.72。假设检验 以一定的标准,对参数的估计结果进行检验。如果在统计意义上,b小于1,说明结果是可接受的。XY7194. 08 .231预报和预测 如果计量模型可以接受,就可用来对因变量进行预测。假定1994年,美国的GDP预计为6万亿美元,则该年的消费支出预计为408560007194. 08 .231Y控制或政策制定 如果希望1994年的消费支出达到4万亿美元,则政府必须通过政策来保证收入水平为:58827194. 08 .2314000X三、计量经济学的内容 可分为理论和应用两大类。 理论
5、计量经济学:研究适当的方法,来测度有计量经济模型设定的经济关系式。应用计量经济学:以理论计量经济学为工具,研究经济学或商业中的各领域。四、计量经济学的应用软件包 有很多种。常用的有:TSP、SPSS、SAS等。第一章 回归分析一、回归分析 分析因变量与解释变量之间的统计依赖关系,目的在于通过后者的已知或设定值去估计或预测前者的均值。假定一个国家的所有家庭的收入(X)和消费支出(Y)统计如下,希望知道家庭消费支出与家庭收入之间的关系:Y=F(X)。YX55100 120140 16080 根据每个家庭的收入和支出绘出散点图,大致可看出二者间的关系:在统计意义上,二者成正比。 由对全体居民的收入和
6、支出的调查结果,我们知道处于不同收入阶层的居民有一个平均的支出水平,这一支出水平与收入大致呈线性关系。 图中的这条通过各收入阶层平均支出额的直线,描述了这一依赖关系。我们把这条线称为回归线。二、统计关系与确定关系 在回归分析中,得到因变量与自变量之间的依赖关系是统计依赖关系,而不是确定关系或函数关系。三、回归与因果关系 回归分析得到的变量间的统计依赖关系,统计关系式自身不代表任何确定的因果关系。四、计量经济分析使用的数据 有三类。 (1)时间序列数据。一个时间序列是对一个变量在不同时间取的一组观测结果。这些数据可以按固定的时间间隔收集。 收集的数据可以是定量的,也可以是定性的(虚拟变量)。 中
7、国1993年1998年的GDP增长率 (%)(2)横截面数据。一个或多个变量在同一时点上收集的数据。 1992年实际GDP增长(3)混合数据。第二章 双变量回归分析第一节 经典正态线性回归模型(CNLRM) 一、基本概念 以下表为例。1、几个概念条件分布(Conditional distribution):以X取定值为条件的Y的条件分布条件概率(Conditional probability):给定X的Y的概率,记为P(Y|X)。例如,P(Y=55|X=80)=1/5;P(Y=150|X=260)=1/7。(表)条件期望(conditional Expectation):给定X的Y的期望值,记
8、为E(Y|X)。例如,E(Y|X=80)=551/5601/5651/5701/5751/565总体回归曲线(Popular Regression Curve)(总体回归曲线的几何意义):当解释变量给定值时因变量的条件期望值的轨迹。2、总体回归函数( Popular Regression Function,PRFE(Y|Xi)=f(Xi)当PRF的函数形式为线性函数,则有,E(Y|Xi)=1+2Xi其中1和2为未知而固定的参数,称为回归系数。1和2也分别称为截距和斜率系数。上述方程也称为线性总体回归函数。3、“线性”的含义 “线性”可作两种解释:对变量为线性,对参数为线性。一般“线性回归”一词
9、总是指对参数为线性的一种回归(即参数只以它的1次方出现)。 4、PRF的随机设定 将个别的Yi围绕其期望值的离差(Deviation)表述如下: ui=Yi-E(Y|Xi) 或 Yi=E(Y|Xi)+ui其中ui为随机误差项(Stochastic error)或随机干扰项(Stochastic disturbance)。线性总体回归函数: PRF:Yi=1+2Xi+ui=E(Y|Xi)+ui5、随机干扰项的意义 随机扰动项是从模型中省略下来的而又集体地影响着Y的全部变量的替代物。显然的问题是:为什么不把这些变量明显地引进到模型中来,而以随即扰动项来替代?理由是多方面的:(1)理论的含糊性:理论
10、不能完全说明影响因变量的所有影响因素。(2)数据的欠缺:无法获得有关数据。(3)核心变量与周边变量:希望能找到与有较大影响的核心变量的关系。(4)内在随机性:因变量具有内在的随机性。(5)替代变量:用来代替不可观测变量的替代变量选择,造成一定误差。(6)省略原则:研究中尽可能使回归式简单。(7)错误的函数形式:回归式的的选择是主观的。6、样本回归函数(SRF) 由于在大多数情况下,我们只知道变量值得一个样本,要用样本信息的基础上估计PRF。(表)样本1样本2iiiuXY21样本回归函数SRF:的估计量为的估计量为的估计量为其中12211,Xi)|E(YY, 在回归分析中,我们用SRF估计PRF
11、。 估计量(Estimator):一个估计量又称统计量(statistic),是指一个规则、公式或方法,以用来根据已知的样本所提供的信息去估计总体参数。在应用中,由估计量算出的数值称为估计(值)(estimate)。样本回归函数SRF的随机形式为:iiiiuYuX Y21i其中 表示(样本)残差项(residual)。iu Xi X PRF:E(Y|Xi)=1+2XiSRF:YE(Y|Xi)iiXY21iu iuiYiY SRF是PRF的近似估计。 为了使二者更为接近,即要使2211,尽可能接近尽可能接近二、经典线性回归模型(CLRM)的基本假定 假定1:回归模型对参数是线性的假定2:在重复抽
12、样中X的值是固定的(非随机) 假定3:干扰项的均值为零。即,E(ui|Xi)=0假定4:同方差性或ui的方差相等。即Var(ui|Xi)=Eui-E(ui)|Xi2 =E(ui2|Xi2 = 2假定5:各个干扰项无自相关。即Cov(ui,uj|Xi,Xj)=Eui-E(ui|Xi) uj-E(uj|Xj) =E(ui|Xi)(uj|Xj) = 0假定6:ui和Xi的协方差为零。即Cov(ui,Xi) = Eui E(ui) Xi E(Xi) = Eui (Xi E(Xi) =E(ui Xi) E(ui)E(Xi) = E(ui Xi) = 0假定7:观测次数必须大于待估计的参数个数。假定8:解
13、释变量X的只要有变异性。即一个样本中,Xi不能完全相同。假定9:模型没有设定误差。假定10:没有完全的多重共线性,即解释变量之间没有完全的线性关系。第二节 双变量回归模型:估计 一、普通最小二乘法(Ordinary Least Squares,OLS) 基本思路:用样本回归函数估计总体回归函数。以iiiuXYSRF21:iiiuXYPRF21:估计iiiiiuYuXY21)(21iiiiiXYYYu残差估计出的参数21和使残差的平方和最小。2212221)()(:min:,iiiiiXYYYu要求和即寻找时,真实值iiiiiiiXnYXnYXYu212121120)(2)(2)(2212212
14、2121220(2)(2)(2)(iiiiiiiiiiiiiiiiXXXYXXXYXXXYXXYu求解这一最小化问题,根据最大化的一阶条件:可得到以下正规方程(Normal equation) :22121iiiiiiXXXYXnY二、参数的估计(点估计):OLS估计量 1、解上述正规方程组得到估计值: 222)()(iiiiiixyxXXYYXXXY21)为离差。()和(的均值,、分别为和其中YYyXXxYXYXiiii, 解出21和,可得到估计值。21和称为最小二乘估计量(OLS估计)。2、 OLS样本回归线的性质: 不相关。与不相关。与)(:由方差最小的一阶条件的均值为零。残差,可得两边
15、求和,并同除的均值:的均值等于实测的的样本均值。和通过iiiiiiiiiiiiiiXuYuXYuXYuYYXXYXXYXYYXY)5()4(002)3(n)()(Y)2(XY)1(21212222121三、2 的估计 真实方差的估计量:222nui22222222)()(iiiiiiiiiixyxyxyYYu四、OLS估计的精度或标准误差 由于OLS估计是根据一个样本得到的,需要检验估计量的可靠性(reliability)或精密度。在统计学中,一个估计量的精密度由它的标准误(standard error, se)来衡量。2222222222222222)()()(,)(,)(0)()()(ii
16、jiiixVARsexkukVARuEjiuuEukEEEVARiiii标准误:方差:对于2221222222211221221)()1()()()(11iiixnXVARxnXxXnukXnuEVARukXnuXuXnXYnXYiiiiiiiiiii标准误:方差:对于1五、OLS 统计量的性质:高斯- 马尔柯夫定理 在CLRM假定下,在所有线性无偏估计量中,OLS估计量有最小方差,即OLS是BLUE(Best Linear Unbiased Estimator)。iiiiiiiiiiiiiiiiiiiiiiiiiiYkXnYkXnYYkXYXYxxxkxxxkxxkxxkYkYxxxYxii
17、i)1(111101)(21222222222222其中 (1)线性: 21和为Yi的线性函数11112121222221212)()()()()()(EukXuXukuXXYuEkEukukXkkuXkYkiiiiiiiiiiiiiiiiiiiii (2)无偏性: 21和为21,的无偏估计量。 (3)最小方差性: OLS估计量 最小。和)()(21VARVAR在所有线性无偏估计量中,具有最小方差。即 可以证明OLS估计量具有最小方差。21和第三节 拟合优度检验 拟合优度检验是指对样本回归线与样本观测值之间拟合程度的检验。度量拟合程度的指标是判定系数R2 。 基本思路:因变量Y的变异,能够被X
18、的变异解释的比例越大,则OLS回归线对总体的解释程度就越好。 Xi X PRFSRFY(来自回归)RSSYY)()RSSui来自残差(TSSYYi)(总离差:iYiY总平方和(TSS):实测的Y值围绕其均值的总变异 :22)(YYyiiY2222222222)(2iiiiiiiiiiiuxuyuyuyuyyTSS222ixESS2iuRSSRSSESSTSS2222)()()(1YYuYYYYTSSRSSTSSESSiiii定义判定系数R2:222)()(YYYYTSSESSRii估计的Y值围绕其均值的总变异 未被解释的围绕回归线的Y值的变异 222)(1:YYuRSSRii或 R2 测度了在
19、Y的总变异中,由回归模型解释的部分所占的比例。 R2 越高,回归模型拟合的程度就越好。 R2 的性质: (1)非负。(2)0R2 1其它表达方式:22222iiyxR2222)(iiiiyxyxR22222)1(iiiyRyRy判定系数与相关系数的关系:判定系数与相关系数的关系: 相关系数:表示两个随机变量之间的相关程度。定义为:YXXYXY22221)(1)(1)(iiyxyxnYYnXXnYYXXSSSriiiiiiYXXYXY 以样本方差和样本协方差估计X、Y的方差和协方差,样本相关系数为: 样本相关系数的平方与判定系数相等,但二者的意义不同。第四节 区间估计 为了判断点估计与真值的接近
20、程度,可以通过构造以估计值为中心的一个区间(随机的),以该区间包括了真值的概率来确定估计值接近真值的把握程度:1)Pr(222上限分别为置信下限和置信)称为显著水平,()称为置信系数称为置信区间2222,;101 ;,一、 的置信区间2也服从正态分布。,服从正态分布,则假定21iu)(,(22222ixVARNu)1 ,0(/)(222222NxSei由于未知,以其估计值代替,)2()(/222222nTsexti-t/2t/2o/2/21)()(Pr22/2222/2setset下,置信区间为在显著水平22/)(ixse 给定置信系数100(1-)%,随机的置信区间将有100(1-)%包含真
21、值2。)(110012/11set )置信区间为(的二、 的置信区间1三、 的置信区间的置信区间为:分布。的服从(在正态假定下,变量222222)2dfn22/1222/2)2,)2nn(第五节 OLS估计量的显著性检验 根据样本回归得到的总体参数的估计量,随着选取样本的不同观测值而不同;给定样本观测值时,得到的参数也与总体参数的真值不同。因此,必须对估计的参数值是否显著成立,做统计检验,即显著性检验。一、 的显著性检验2)2()(/222222nTsexti原假设 H0:2 = 0备择假设 H1: 2 0)(|)2)(102/102/22显著,接受拒绝,拒绝接受若分布表(下,查在显著水平计算
展开阅读全文