书签 分享 收藏 举报 版权申诉 / 45
上传文档赚钱

类型现代地理学中的数学方法(9)课件.ppt

  • 上传人(卖家):三亚风情
  • 文档编号:3309874
  • 上传时间:2022-08-18
  • 格式:PPT
  • 页数:45
  • 大小:1.78MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《现代地理学中的数学方法(9)课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    现代 地理学 中的 数学 方法 课件
    资源描述:

    1、第2节 空间计量模型空间滞后与空间误差模型地理加权回归模型应用实例:研发与创新的空间计量模型 空间计量模型的基本思想,是引入区域间的相互关系,通过空间权重矩阵W,对线性回归模型进行修正。空间计量模型有很多种。本节主要探讨空间滞后模型(SLM)与空间误差模型(SEM),以及空间变系数回归模型地理加权回归模型(GWR)及其应用问题。空间滞后模型(spatial lag model,SLM),主要是用于研究相邻机构或地区的行为对整个系统内其它机构或地区的行为存在影响的情况。该模型的数学表达式为:式中:y为因变量;X为 阶的外生解释变量矩阵;W是 阶的空间权重矩阵,即n个地区之间相互关系结构矩阵;为空

    2、间滞后因变量;是空间自回归系数,反映了样本观测值中的空间依赖作用,即相邻区域的观测值 对本地区观测值y的影响方向和程度;为X的参数向量;为白噪声。一、空间滞后与空间误差模型一、空间滞后与空间误差模型 (一)空间滞后模型XWyyknnnWyWy(6.2.1)(二)空间误差模型(二)空间误差模型 在空间误差模型(SEM)中,机构或地区间的相互关系通过误差项来体现。当机构或地区间的相互作用因所处的相对位置不同而存在差异时,则需要采用这种模型。空间误差模型(SEM)的数学表达式为:式中,为随机误差项向量,为 的的截面因变量向量的空间误差系数,为正态分布的随机误差向量。(6.2.2)WXy1n 参数 衡

    3、量了样本观察值中的空间依赖作用,即相邻地区的观察值y对本地区观察值y的影响方向和程度,参数反映了自变量X对因变量y的影响。SEM的空间依赖作用存在于扰动误差项之中,度量了邻接地区关于因变量的误差冲击对本地区观察值的影响程度。(三)估计技术(三)估计技术n空间滞后模型空间滞后模型的估计过程如下的估计过程如下:对模型 作OLS估计;对模型 作OLS估计;分别计算上述两个OLS估计的残差 和 ;00 xyLLXWyXye00XWyeLL 由 和 值,通过极大化集中对数似然函数得到 的参数 的估计值 ;0eLeCL WIeeeennLLLCln/1ln)2/(00 由 值计算其余参数估计值 ,极大对数

    4、似然函数 如果SLM模型设定正确,那么解释变量在重复抽样过程中的变动将会导致OLS估计产生有偏且不一致的结果。L0?LLeeeen/1002 XWyyXWyyWILogL2/1lnln2/n2ln2/n22n空间空间误差误差模型模型的估计过程如下的估计过程如下:对模型 进行OLS估计,得到 的无偏估计值 ;计算OLS估计的残差为 ;由 值,通过对数极大似然函数 得到参数 的估计值 ;uxyXyeecL|ln)()(/1ln()2/(WIWeeWeennnLc 由 计算其余参数的估计值,极大对数似然函数 如果SEM模型设定正确,那么误差项的空间依赖将会导致OLS估计产生无偏但不一致的结果。)()

    5、(/1(2cWeWeeneWIWeWINNLc)()1()2/1(|lnln)2/()2ln()2/(log22 判断地区间经济行为的空间相关性是否存在,一般通过包括 Morans I 检验、两个拉格朗日乘数(Lagrange Multiplier)形式的LMERR、LMLAG和稳健(Robust)的R-LMERR、R-LMLAG等来进行。由于事先无法根据先验经验推断在SLM和SEM模型中是否存在空间依赖性,有必要构建一种判别准则判别准则,以决定哪种空间模型更加符合客观实际。(四)空间自相关检验与(四)空间自相关检验与SLMSLM、SEMSEM的选择的选择 Anselin,et al.(200

    6、4)提出了如下判别准则判别准则:如果在空间依赖性的检验中发现,LMLAG较之LMERR在统计上更加显著,且R-LMLAG显著而R-LMERR不显著,则可以断定适合的模型是空间滞后空间滞后模型模型;相反,如果LMERR比LMLAG在统计上更加显著,且R-LMERR显著而R-LMLAG不显著,则可以断定空间误差模型空间误差模型是恰当的模型。除了拟合优度R2检验以外,常用的检验准则还有:自然对数似然函数值(LogL),似然比率(LR)、赤池信息准则(AIC),施瓦茨准则(SC)。对数似然值的越大,似然率越小,AIC和SC值越小,模型拟合效果越好。这几个指标也用来比较OLS估计的经典线性回归模型和SL

    7、M、SEM,似然值的自然对数最大的模型最好。二、地理加权回归模型二、地理加权回归模型 当用横截面数据建立计量经济模型时,由于这种数据在空间上表现出的复杂性、自相关性和变异性,使得解释变量对被解释变量的影响在不同区域之间可能是不同的。假定区域之间的经济行为在空间上具有异质性的差异可能更加符合现实,空间变系数回归模型中的地理加权回归模型(GWR)是一种解决这种问题的有效方法。n全域线性回归模型全域线性回归模型 假定我们有 、的系列解释变量观测值 及系列被解释变量 ,经典的全域(Global)线性回归模型为:式中:是整个回归模型的随机误差项,满足球形扰动假设;回归系数 被假定是一个常数。模型参数 的

    8、估计一般采用普通最小二乘(OLS)法。mi,.,2,1nj,.,2,1 ijx jymixyinjjiji,.,2,110(6.2.3)jnGWRGWR模型模型 地理加权回归模型是一种相对简单的回归估计技术,它扩展了普通线性回归模型(6.2.3)式。在扩展的GWR模型中,特定区位i 的回归系数不再是利用全部信息获得的假定常数 ,而是利用邻近观测值的子样本数据信息进行局域(Local)回归估计而得的、随着空间上局部地理位置i 变化而变化的变数 。0jGWR模型可以表示为:式中:系数 的下标 表示与观测值联系的 阶待估计参数向量,是关于地理位置 的 元函数。(6.2.4)iijiijkiiixvu

    9、vuy,k10jj1miivu,1kn估计函数估计函数 GWR可以对每个观测值估计出k个参数向量的估计值,是第i个区域的随机误差,满足零均值、同方差、相互独立等球形扰动假定。实际上,模型(6.2.4)可表示为在每个区域都有一个对应的估计函数,其对数似然函数可以表示为:式中:为常数,。(6.2.5)211020,21|,lognikjiiikiiikxvuvuyMvuvuLLLkjnivuxyMiiiji,2,1,2,1,LL实际研究中常用的空间距离权值计算公式有3种:高斯距离权值(Gaussian distance)指数距离权值(exponential distance)三次方距离权值(tri

    10、cube distance)/ijijdWqdWijij/exp 33/1ijijdW 在以上3个公式中,为第i个区域与第j个区域间的地理位置距离,为标准正态分布密度函数,q为观测值i到第q个最近邻居之间的距离,为距离向量 的标准差,为衰减参数(窗宽)。ijdijd 在空间权值矩阵 中,d和 非常关键。如果d较大,则局域模型的解越趋向于全域模型的解;如果d等于所研究空间任意两点间的最大距离,则全域和局域两个模型将相等,反之则相反。若 趋于无穷大,任意两点的权重将趋于1,则被估计的参数变成一致时,GWR就等于以OLS估计的经典线性回归;反之,当带宽变得很小时,参数估计将更加依赖于邻近的观测值。i

    11、jW三、应用实例:研发与创新的空间计量模型三、应用实例:研发与创新的空间计量模型 为检验研发与创新的空间效应,建立双对数线性的知识生产函数模型如下:式中:被解释变量为十万人专利授权数(I),代表专利创新产出;以大学(U)、企业(E)研发投入占GDP的比例为解释变量;为回归参数,i代表以省域为单元的空间样本(),为随机误差项。iiEUIlnlnln21031,.,2,1i 模型实证分析所用的数据样本数据样本,包括了中国大陆地区31个省(自治区、直辖市,简称为省域),数据来源于20012004年的中国统计年鉴,而创新投入则来源于2001年的中国统计年鉴。建模的目的目的,是检验大学、企业与区域创新产

    12、出活动的相互关系和决定因素,尤其是通过合适的估计方法考察省域创新产出的决定因素和局域溢出效应。一般来说,创新从投入到产出需要经过一定时期的滞后。为了验证创新投入产出的滞后性假设,以2000年、2001年、2002年、2003年的lnI分别为被解释变量,以2000年的lnU、lnE分别作为解释变量。原始如表6.2.1所示。省(市、区)lnIlnUlnEEastNorth北京3.797 54.254 05.274 240.245 4116.461 2天津2.898 32.820 64.606 239.411 0117.367 0河北1.605 11.831 83.555 639.331 9116.

    13、650 2山西1.042 21.316 33.687 037.633 9112.368 4内蒙古1.048 80.651 22.669 145.371 4118.600 4辽宁2.382 11.650 34.076 341.098 4122.303 3吉林1.719 81.704 23.675 143.579 1126.470 0黑龙江1.698 01.792 03.464 448.486 9127.986 5上海3.718 42.792 74.529 731.271 9121.375 0江苏2.331 21.971 64.117 334.583 4119.282 8浙江3.115 71.70

    14、7 43.760 829.165 1120.427 8安徽0.806 02.543 33.481 532.013 0117.270 4福建2.446 11.247 03.801 525.939 4118.181 3江西0.905 30.503 83.225 927.282 6116.030 0山东2.083 20.595 73.964 136.323 5118.749 0表 6.2.1 建模数据准备注:表中East表示经度,North表示纬度。省(市、区)lnIlnUlnEEastNorth河南0.991 10.175 03.426 433.876 4113.478 5湖北1.305 42.3

    15、22 33.785 731.143 1112.264 3湖南1.264 32.095 43.578 527.379 4111.515 0广东3.366 01.333 44.590 322.870 4113.429 9广西0.782 01.522 53.391 723.698 7108.270 6海南0.907 5-1.578 12.020 119.159 5109.827 8重庆1.734 82.240 73.654 930.185 5107.739 9四川1.367 02.112 23.542 330.186 9102.948 5贵州0.471 80.056 23.548 626.918 9

    16、106.565 4云南0.956 81.020 82.661 925.182 2101.858 0西藏-1.338 81.472 2-2.058 131.667 688.749 2陕西1.422 63.283 64.734 235.643 2109.556 1甘肃0.426 01.262 73.537 337.683 3102.897 1青海0.474 20.689 03.503 435.427 796.228 6宁夏1.328 70.298 73.953 037.325 9105.958 2新疆1.191 3-0.372 62.728 341.747 284.964 8表 6.2.1 建模数

    17、据准备(续)注:表中East表示经度,North表示纬度。首先检测2002年中国大陆地区31个省级行政区创新产出在地理空间上的相关性即空间相互依赖性。根据表1中的数据计算得到专利产出的Moran指数为0.360 0,其正态统计量Z值大于正态分布函数在0.002 0水平下的临界值,表明中国31个省、直辖市和自治区的专利数在空间分布上具有正的自相关性正的自相关性,说明全国各省域创新的空间分布并非表现出完全随机状态,而是表现出相似值之间的空间集群相似值之间的空间集群(clustering)。(一)空间自相关性检验(一)空间自相关性检验 因此,从整体上讲,省域之间的创新是存在空间相关性的,也就是说存在

    18、着空间上明显的集群现象。因此,有必要在使用空间计量经济模型进行估计。(二)空间计量估计与分析(二)空间计量估计与分析 空间相关分析已经定量证明了中国大陆地区省级行政区创新产出具有空间相关性,需要采用空间计量经济模型进行估计。为此,以下的思路是:以中国大陆31个省级行政区为空间单元,进行省级行政区创新的空间计量经济检验和估计。为了比较,先进行OLS估计。首先进行普通最小二乘(OLS)法的估计,以及通过Moran指数检验、两个拉格朗日乘数来判断空间计量经济学模型SLM和SEM的形式,利用极大似然法(ML)估计参数,利用Anselin(2004)的空间计量经济学软件GeoDa 0.9.5-I计算,结

    19、果如表6.2.2所示。表 6.2.2 OLS估计结果模型回归系数 标准差 统计值小概率 值C-0.779 5*0.399 8-1.949 60.061 3U0.179 20.125 61.426 20.164 9E0.592 6*0.118 15.018 80.000 00.585 2 0.555 6 F19.749 6*0.000 0LogL-32.335 2 AIC70.670 4 SC74.972 4 空间依赖性检验MI/DF统计值小概率P Morans I(error)0.277 8*2.804 6 0.005 0 LMLAG13.981 7*0.046 0 R-LMLAG10.143

    20、 0 0.705 4 LMERR15.108 5*0.023 8 R-LMERR11.269 7 0.259 8 tp2R2adjR注:*、*、*分别表示通过10%、5%、1%水平下的显著性检验。由表6.2.2中结果可知,OLS估计的31个省级行政区创新函数的拟合优度达到55.56,F值为19.749 6,模型整体上通过了1水平的显著性检验。由于前述的空间统计的Moran指数检验已经证明了31个省级行政区的创新产出之间具有明显的空间自相关性,这说明忽视空间自相关性直接采用OLS法建立模型进行估计分析存在一定问题,出现这种问题的原因可能有两个:一是遗漏了重要的变量,二是模型设定有问题,如未能考虑

    21、截面单元(省域)之间的空间相关性。为了进一步验证空间自相关性的存在,由表6.2.2中的Moran指数检验、两个拉格朗日乘数的空间依赖性检验结果显示:Morans I(error)检验表明经典回归误差的空间依赖性(相关性)非常明显(显著性水平为0.1)。同时为区分是内生的空间滞后还是空间误差自相关,根据前面介绍的判别准则,拉格朗日乘子误差和滞后及其稳健性检验表明,LMLAG通过了4.60水平下的显著性检验,LMERR通过了2.38水平下的显著性检验,而R-LMERR、R-LMLAG均未能通过10水平下的显著性检验。比较SLM和SEM模型对数似然函数值LogL、AIC和SC值、LogL、LR,相对

    22、而言,SEM模型相对更好一些。当然,这种判断不是特别严格,为此给出了SLM和SEM的估计结果见表6.2.3。表 6.2.3 SLM和SEM估计结果注:*、*、*分别表示通过10%、5%、1%水平下的显著性检验。变量Std.Et 统计值P值Std.Et统计值P值C-0.960 7*-2.548 10.377 00.010 8-0.418 7 0.399 1-1.049 20.294 1 U0.071 80.610 90.117 60.541 30.105 2 0.103 6 1.015 5 0.309 9 E0.547 0*0.106 95.115 50.000 00.562 7*0.098 1

    23、 5.735 3 0.000 0/0.351 8*0.173 82.023 90.043 00.568 6*0.171 4 3.318 6 0.000 9 统计检验DF统计值P值 DF统计值P值 0.642 6 0.684 0 LogL-30.486 6 -29.466 0 LR13.697 1*0.054 5 15.738 3*0.016 6 AIC 68.973 3 64.932 1 SC 74.709 2 69.234 0 SLMSEM2R 比较表6.2.2和表6.2.3中的检验结果发现,空间滞后模型和空间误差模型的拟合优度检验值均高于OLS模型,由于采用ML法估计参数,基于残差平方和分

    24、解的拟合优度检验的意义不是很大。为此,比较对数似然函数值LogL,发现SEM的LogL值(-29.466 0)最大,极大似然比率通过了5水平的显著性检验,而AIC和SC值最小,因此SEM模型均比OLS和SLM估计的模型要好。由此可见,基于OLS法的经典线性回归模型由于遗漏了空间误差自相关性而设定的模型不够恰当。这也验证了这样的观点:省域之间的创新产出都不可能没有关系。以往的研究大多假定地区之间相互独立,导致了基于OLS法估计结果及推论可能不够可靠,需要通过引入空间差异性和空间依赖性对经典的线性模型进行修正。由于OLS、SLM和SEM模型均为全域(global)估计,这些模型给出的回归系数在整体

    25、上被假定为一个常数,无法揭示局域(local)各个省域的因素对局域创新产出的影响。为了解决解决这个问题,基于地理加权回归模型,采用LeSage(1998)的计算程序,运用加权最小二乘法(WLS)来进行局域估计。以高斯(Gaussian)、指数(exponential)和三次方(tricube)距离为权值,估计GWR模型的参数估计值。其中,高斯距离权值和指数距离权值的衰减参数(窗宽)为1.189 3和4.472 1,三次方距离权值的q最邻近邻居为10。图6.2.1给出了高斯、指数和三次方距离为权值的GWR模型的参数估计值。图6.2.1 Gaussian、exponential和tricube 距

    26、离权值的GWR参数估计值 在高斯距离估计的GWR模型中,调整后的 =0.728 2,高于全域估计值OLS、SLM、SEM(0.555 6、0.642 6、0.684 0)。这表明考虑了地理空间位置的地理加权回归模型的整体拟合效果要优于OLS、SLM、SEM全域估计模型,假定回归系数固定不变是不完全符合空间和地理邻近性发挥作用的区域创新实践的。即中国大陆地区31个省域的创新产出能力在空间上具有异质性的差异。R2省(市、区)CtUtEt北京2.082 02.648 20.096 70.656 00.970 43.984 1天津2.120 72.678 60.085 20.573 80.989 94

    27、.038 7河北2.121 62.669 80.087 60.590 90.985 84.012 6山西2.187 42.622 20.092 40.641 30.969 43.817 7内蒙古1.913 22.603 10.123 10.843 60.924 73.979 9辽宁2.129 72.749 50.075 90.505 71.012 34.177 9吉林2.102 22.788 70.077 00.513 71.012 64.255 6黑龙江1.986 32.774 00.096 60.654 60.975 74.256 7上海2.530 72.931 10.014 60.093

    28、 41.162 24.369 7江苏2.401 62.846 20.023 70.154 31.101 14.238 2浙江2.506 72.902 40.028 90.184 51.161 84.367 5安徽2.444 42.839 00.002 20.014 31.116 44.230 1福建2.320 52.775 80.042 90.277 81.115 64.316 4江西2.201 72.679 50.021 30.140 01.064 44.201 9山东2.319 32.799 70.044 00.289 41.067 14.177 3表 6.2.4 基于高斯距离权值的GWR

    29、估计结果省(市、区)CtUtEt河南2.323 02.711 50.039 50.266 31.041 83.997 8湖北2.078 02.539 70.032 40.222 50.977 93.922 6湖南1.683 92.310 90.026 40.186 10.882 63.934 9广东1.697 82.366 20.014 80.102 80.922 94.127 4广西1.100 41.954 60.054 90.423 90.706 34.058 8海南1.202 02.045 80.007 40.056 20.769 84.173 5重庆1.234 31.995 70.10

    30、7 50.835 10.692 63.698 1四川0.776 11.979 70.157 61.397 40.522 94.564 0贵州0.989 21.888 80.096 20.770 40.639 84.012 1云南0.687 81.888 50.113 91.008 70.533 54.946 3西藏0.550 62.715 60.109 71.115 40.460 28.854 1陕西1.836 42.343 30.120 50.895 40.838 43.561 6甘肃0.925 52.282 90.228 92.180 80.500 54.317 2青海0.670 42.7

    31、60 80.173 41.718 30.457 47.133 9宁夏1.239 72.091 30.202 61.752 00.611 43.502 0新疆0.447 22.484 50.040 50.442 00.450 29.428 1表 6.2.4 基于高斯距离权值的GWR估计结果(续)表6.2.4给出了31个省级行政区以高斯距离估计的局域回归系数估计值,结果显示:整体来看,在影响中国大陆地区31个省级行政区创新产出的因素中,U未能通过5水平的变量显著性检验,表明大学研发对区域创新产出虽然具有正的贡献但不明显;所有省级行政区的企业研发变量均通过了5水平下的变量显著性检验,其中上海、浙江、安徽、福建、江苏、山东、江西、河南、吉林、辽宁、天津、河北等东中部地区的研发投入对创新的贡献更大,其弹性系数基本上在1以上。

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:现代地理学中的数学方法(9)课件.ppt
    链接地址:https://www.163wenku.com/p-3309874.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库