现代地理学中的数学方法(9)课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《现代地理学中的数学方法(9)课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 现代 地理学 中的 数学 方法 课件
- 资源描述:
-
1、第2节 空间计量模型空间滞后与空间误差模型地理加权回归模型应用实例:研发与创新的空间计量模型 空间计量模型的基本思想,是引入区域间的相互关系,通过空间权重矩阵W,对线性回归模型进行修正。空间计量模型有很多种。本节主要探讨空间滞后模型(SLM)与空间误差模型(SEM),以及空间变系数回归模型地理加权回归模型(GWR)及其应用问题。空间滞后模型(spatial lag model,SLM),主要是用于研究相邻机构或地区的行为对整个系统内其它机构或地区的行为存在影响的情况。该模型的数学表达式为:式中:y为因变量;X为 阶的外生解释变量矩阵;W是 阶的空间权重矩阵,即n个地区之间相互关系结构矩阵;为空
2、间滞后因变量;是空间自回归系数,反映了样本观测值中的空间依赖作用,即相邻区域的观测值 对本地区观测值y的影响方向和程度;为X的参数向量;为白噪声。一、空间滞后与空间误差模型一、空间滞后与空间误差模型 (一)空间滞后模型XWyyknnnWyWy(6.2.1)(二)空间误差模型(二)空间误差模型 在空间误差模型(SEM)中,机构或地区间的相互关系通过误差项来体现。当机构或地区间的相互作用因所处的相对位置不同而存在差异时,则需要采用这种模型。空间误差模型(SEM)的数学表达式为:式中,为随机误差项向量,为 的的截面因变量向量的空间误差系数,为正态分布的随机误差向量。(6.2.2)WXy1n 参数 衡
3、量了样本观察值中的空间依赖作用,即相邻地区的观察值y对本地区观察值y的影响方向和程度,参数反映了自变量X对因变量y的影响。SEM的空间依赖作用存在于扰动误差项之中,度量了邻接地区关于因变量的误差冲击对本地区观察值的影响程度。(三)估计技术(三)估计技术n空间滞后模型空间滞后模型的估计过程如下的估计过程如下:对模型 作OLS估计;对模型 作OLS估计;分别计算上述两个OLS估计的残差 和 ;00 xyLLXWyXye00XWyeLL 由 和 值,通过极大化集中对数似然函数得到 的参数 的估计值 ;0eLeCL WIeeeennLLLCln/1ln)2/(00 由 值计算其余参数估计值 ,极大对数
4、似然函数 如果SLM模型设定正确,那么解释变量在重复抽样过程中的变动将会导致OLS估计产生有偏且不一致的结果。L0?LLeeeen/1002 XWyyXWyyWILogL2/1lnln2/n2ln2/n22n空间空间误差误差模型模型的估计过程如下的估计过程如下:对模型 进行OLS估计,得到 的无偏估计值 ;计算OLS估计的残差为 ;由 值,通过对数极大似然函数 得到参数 的估计值 ;uxyXyeecL|ln)()(/1ln()2/(WIWeeWeennnLc 由 计算其余参数的估计值,极大对数似然函数 如果SEM模型设定正确,那么误差项的空间依赖将会导致OLS估计产生无偏但不一致的结果。)()
5、(/1(2cWeWeeneWIWeWINNLc)()1()2/1(|lnln)2/()2ln()2/(log22 判断地区间经济行为的空间相关性是否存在,一般通过包括 Morans I 检验、两个拉格朗日乘数(Lagrange Multiplier)形式的LMERR、LMLAG和稳健(Robust)的R-LMERR、R-LMLAG等来进行。由于事先无法根据先验经验推断在SLM和SEM模型中是否存在空间依赖性,有必要构建一种判别准则判别准则,以决定哪种空间模型更加符合客观实际。(四)空间自相关检验与(四)空间自相关检验与SLMSLM、SEMSEM的选择的选择 Anselin,et al.(200
6、4)提出了如下判别准则判别准则:如果在空间依赖性的检验中发现,LMLAG较之LMERR在统计上更加显著,且R-LMLAG显著而R-LMERR不显著,则可以断定适合的模型是空间滞后空间滞后模型模型;相反,如果LMERR比LMLAG在统计上更加显著,且R-LMERR显著而R-LMLAG不显著,则可以断定空间误差模型空间误差模型是恰当的模型。除了拟合优度R2检验以外,常用的检验准则还有:自然对数似然函数值(LogL),似然比率(LR)、赤池信息准则(AIC),施瓦茨准则(SC)。对数似然值的越大,似然率越小,AIC和SC值越小,模型拟合效果越好。这几个指标也用来比较OLS估计的经典线性回归模型和SL
7、M、SEM,似然值的自然对数最大的模型最好。二、地理加权回归模型二、地理加权回归模型 当用横截面数据建立计量经济模型时,由于这种数据在空间上表现出的复杂性、自相关性和变异性,使得解释变量对被解释变量的影响在不同区域之间可能是不同的。假定区域之间的经济行为在空间上具有异质性的差异可能更加符合现实,空间变系数回归模型中的地理加权回归模型(GWR)是一种解决这种问题的有效方法。n全域线性回归模型全域线性回归模型 假定我们有 、的系列解释变量观测值 及系列被解释变量 ,经典的全域(Global)线性回归模型为:式中:是整个回归模型的随机误差项,满足球形扰动假设;回归系数 被假定是一个常数。模型参数 的
8、估计一般采用普通最小二乘(OLS)法。mi,.,2,1nj,.,2,1 ijx jymixyinjjiji,.,2,110(6.2.3)jnGWRGWR模型模型 地理加权回归模型是一种相对简单的回归估计技术,它扩展了普通线性回归模型(6.2.3)式。在扩展的GWR模型中,特定区位i 的回归系数不再是利用全部信息获得的假定常数 ,而是利用邻近观测值的子样本数据信息进行局域(Local)回归估计而得的、随着空间上局部地理位置i 变化而变化的变数 。0jGWR模型可以表示为:式中:系数 的下标 表示与观测值联系的 阶待估计参数向量,是关于地理位置 的 元函数。(6.2.4)iijiijkiiixvu
9、vuy,k10jj1miivu,1kn估计函数估计函数 GWR可以对每个观测值估计出k个参数向量的估计值,是第i个区域的随机误差,满足零均值、同方差、相互独立等球形扰动假定。实际上,模型(6.2.4)可表示为在每个区域都有一个对应的估计函数,其对数似然函数可以表示为:式中:为常数,。(6.2.5)211020,21|,lognikjiiikiiikxvuvuyMvuvuLLLkjnivuxyMiiiji,2,1,2,1,LL实际研究中常用的空间距离权值计算公式有3种:高斯距离权值(Gaussian distance)指数距离权值(exponential distance)三次方距离权值(tri
10、cube distance)/ijijdWqdWijij/exp 33/1ijijdW 在以上3个公式中,为第i个区域与第j个区域间的地理位置距离,为标准正态分布密度函数,q为观测值i到第q个最近邻居之间的距离,为距离向量 的标准差,为衰减参数(窗宽)。ijdijd 在空间权值矩阵 中,d和 非常关键。如果d较大,则局域模型的解越趋向于全域模型的解;如果d等于所研究空间任意两点间的最大距离,则全域和局域两个模型将相等,反之则相反。若 趋于无穷大,任意两点的权重将趋于1,则被估计的参数变成一致时,GWR就等于以OLS估计的经典线性回归;反之,当带宽变得很小时,参数估计将更加依赖于邻近的观测值。i
11、jW三、应用实例:研发与创新的空间计量模型三、应用实例:研发与创新的空间计量模型 为检验研发与创新的空间效应,建立双对数线性的知识生产函数模型如下:式中:被解释变量为十万人专利授权数(I),代表专利创新产出;以大学(U)、企业(E)研发投入占GDP的比例为解释变量;为回归参数,i代表以省域为单元的空间样本(),为随机误差项。iiEUIlnlnln21031,.,2,1i 模型实证分析所用的数据样本数据样本,包括了中国大陆地区31个省(自治区、直辖市,简称为省域),数据来源于20012004年的中国统计年鉴,而创新投入则来源于2001年的中国统计年鉴。建模的目的目的,是检验大学、企业与区域创新产
12、出活动的相互关系和决定因素,尤其是通过合适的估计方法考察省域创新产出的决定因素和局域溢出效应。一般来说,创新从投入到产出需要经过一定时期的滞后。为了验证创新投入产出的滞后性假设,以2000年、2001年、2002年、2003年的lnI分别为被解释变量,以2000年的lnU、lnE分别作为解释变量。原始如表6.2.1所示。省(市、区)lnIlnUlnEEastNorth北京3.797 54.254 05.274 240.245 4116.461 2天津2.898 32.820 64.606 239.411 0117.367 0河北1.605 11.831 83.555 639.331 9116.
13、650 2山西1.042 21.316 33.687 037.633 9112.368 4内蒙古1.048 80.651 22.669 145.371 4118.600 4辽宁2.382 11.650 34.076 341.098 4122.303 3吉林1.719 81.704 23.675 143.579 1126.470 0黑龙江1.698 01.792 03.464 448.486 9127.986 5上海3.718 42.792 74.529 731.271 9121.375 0江苏2.331 21.971 64.117 334.583 4119.282 8浙江3.115 71.70
14、7 43.760 829.165 1120.427 8安徽0.806 02.543 33.481 532.013 0117.270 4福建2.446 11.247 03.801 525.939 4118.181 3江西0.905 30.503 83.225 927.282 6116.030 0山东2.083 20.595 73.964 136.323 5118.749 0表 6.2.1 建模数据准备注:表中East表示经度,North表示纬度。省(市、区)lnIlnUlnEEastNorth河南0.991 10.175 03.426 433.876 4113.478 5湖北1.305 42.3
15、22 33.785 731.143 1112.264 3湖南1.264 32.095 43.578 527.379 4111.515 0广东3.366 01.333 44.590 322.870 4113.429 9广西0.782 01.522 53.391 723.698 7108.270 6海南0.907 5-1.578 12.020 119.159 5109.827 8重庆1.734 82.240 73.654 930.185 5107.739 9四川1.367 02.112 23.542 330.186 9102.948 5贵州0.471 80.056 23.548 626.918 9
展开阅读全文