大学精品课件:第六章-空间数据的统计分析-3-本.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《大学精品课件:第六章-空间数据的统计分析-3-本.ppt》由用户(罗嗣辉)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大学 精品 课件 第六 空间 数据 统计分析 _3_
- 资源描述:
-
1、第七章第七章 空间数据的统计分析方法空间数据的统计分析方法(3)武汉大学遥感信息工程学院遥感科学与技术本科生教案武汉大学遥感信息工程学院遥感科学与技术本科生教案(2013)秦秦 昆昆2地统计分析概述空间变异函数克里金估计方法地统计分析研究展望ArcGIS的地统计分析工具主要内容主要内容3地统计分析概述420世纪50年代,南非采矿工程师南非采矿工程师Daniel Krige总结多年金矿勘探经验,提出根据样品点的空间位置和样品点之间空间相关程度,对每个样品观测值赋予一定的权重,进行移动加权平均,估计被样品点包围的未知点矿产储量,形成了克里金估计方法(kriging)的雏形。20世纪60年代初期,法
2、国地质数学家法国地质数学家Georges Matheron提出数学形式的区域化变量,严格地给出了基本变异函数(variogram)的定义和一般克里金估计方法。通过对变异函数、克里金估计以及随机模拟方法的深入扩展,地统计学地统计学(Geostatistics)已经成为空间统计学空间统计学的核心内容,其理论体系的深度和方法扩展宽度是其它空间统计方法无法比拟的。地统计分析概述(Geostatistics)5国内的地统计工作主要集中于地质勘探建模地质勘探建模和地理地理(环环境境)空间数据分析空间数据分析应用方面。国际上,地统计不仅是地质领域数学地质的主要分支,同时也逐渐成为数学领域应用统计的一个新分支
3、。地统计学地统计学(Geostatistics),也称为地质统计学地质统计学,是一门以区域化变量理论为基础,以变异函数为主要工具,研究那些分布于空间上既有随机性又有结构性既有随机性又有结构性的自然或社会现象的科学。主要包括:区域化变量的变异函数模型区域化变量的变异函数模型、克里金估计克里金估计和随机模拟随机模拟三个主要内容。相对于物理机制建模,地统计是一种分析空间位置(空间结构)相关地学信息的经验性方法(赵鹏大,2004)。地统计分析概述6地理信息是地理空间位置相关的信息。地理信息科学是一门研究地理信息获取、处理和利用中的基本规律的科学,与地统计学存在本质联系。地统计学和地理信息科学存在重叠的
4、研究对象地统计学和地理信息科学存在重叠的研究对象,即地理空间相关信息。地统计学遵从相近相似规律相近相似规律(空间位置相近的地学现象具有相似属性值),这与地理信息分析中的地理学第一地理学第一定律定律(空间相近的地理现象比空间远离的地理现象具有更强的相关性)完全一致。地统计学和地理学第一定律同在20世纪60年代被独立提出。地统计分析概述7尽管地理信息系统中还存在空间自回归模型(空间滞后模型和空间误差模型)、地理加权回归和各种空间结构(空间分布)探索等空间统计分析方法,但是地统计一直是理论基础最为完善且应用扩展最为但是地统计一直是理论基础最为完善且应用扩展最为广泛的主流空间统计方法,广泛的主流空间统
5、计方法,地统计学已经成为地理信息科学中地理信息处理和分析的重要理论,地统计分析功能被直接嵌入或平行连接到地理空间或遥感影像信息系统中。地统计分析概述8地统计具有不同于传统统计的两个显著特点:1 1)样本点的空间相关性)样本点的空间相关性。传统统计中不同样本点仅具有随机性,样本点之间保持空间独立性。然而,地统计中样本点不仅具有随机性,同时样本点之间具有空间相关性。2 2)一次性样本采集。)一次性样本采集。传统统计分析同一空间位置处可以多次采样数据。实际地统计分析中,样本区域中每一个空间位置多为一次采样数据。根据传统统计学,一次采样数据中无法推断出总体规律。这这两个特点导致了地统计中描述空间相关性
6、两个特点导致了地统计中描述空间相关性(空间结构空间结构)的的变异函变异函数数和克服一次采样局限的和克服一次采样局限的平稳性假设平稳性假设的提出。的提出。区域化变量的空间相关(不同空间位置变量的相关)也称为空间自相关,区域化变量的协方差(不同空间位置变量的相关)也称为空间自协方差。地统计分析概述9空间变异函数空间变异函数10区域化变量的定义和平稳性假设区域化变量的定义和平稳性假设当空间被赋予地学含义时,地学工作者习惯称其为区域。发现地表空间的区域差异正是地理学研究的基本任务。当一个专题变量分布于空间,呈现一定的结构性和随机性时,在地统计学上称之为“区域化”,区域化变量(regionalized
7、variable)描述的现象为区域化现象。空间变异函数空间变异函数变异函数(区域化变量的定义和平稳性假设)变异函数(区域化变量的定义和平稳性假设)定义:定义:设设Z(x)为一随机变量,表示在空间位置为一随机变量,表示在空间位置x处专题变量处专题变量取值是随机的,区域化变量是区域化随机变量的简称。取值是随机的,区域化变量是区域化随机变量的简称。Z(X)=Z(x),x X表示区域表示区域X中所有空间位置中所有空间位置x处随机处随机变量变量Z(x)的集合的集合(簇簇),又称为,又称为随机场随机场,随机场也可看作若干空间样本(空间函数)的集合。随机场也可看作若干空间样本(空间函数)的集合。1112区域
8、化变量即空间位置相关的随机变量。区域化变量为具有内在空间结构的随机变量,它是随机场的简化。区域化变量理论重点研究区域化随机变量的各种空间结构和统计性质,变异函数是描述区域化随机变量空间结构的有效数学工具,克里金估计利用区域化变量结构性质进行估值应用。变异函数(区域化变量的定义和平稳性假设)变异函数(区域化变量的定义和平稳性假设)n地统计中的数据多为区域中每个空间位置的一次采地统计中的数据多为区域中每个空间位置的一次采样数据。样数据。n为了满足总体规律推断中多个样本为了满足总体规律推断中多个样本(大样本大样本)的数据的数据要求,地统计中使用平稳要求,地统计中使用平稳(second-order s
9、tationary)或或内蕴内蕴(intrinsic stationary)假设下假设下多个空间位置采样数多个空间位置采样数据据(每个位置依然是一次采样数据每个位置依然是一次采样数据)来来替代单个位置替代单个位置上的多次采样数据上的多次采样数据(传统统计的采样数据传统统计的采样数据)。n机理上,机理上,相近相似规律的普适性相近相似规律的普适性、空间结构的稳定空间结构的稳定性性、地学现象空间结构形成的驱动地学现象空间结构形成的驱动(动力动力)因素的不因素的不变性变性等表明了平稳性假设的现实合理性。等表明了平稳性假设的现实合理性。13变异函数(区域化变量的定义和平稳性假设)变异函数(区域化变量的定
10、义和平稳性假设)变异函数(区域化变量的定义和平稳性假设)变异函数(区域化变量的定义和平稳性假设)存在存在n个随机变量的联合分布个随机变量的联合分布F(Z(x1),Z(x2),Z(xn),严格的平稳性严格的平稳性指随机变量联合分布的指随机变量联合分布的空间位移不变性空间位移不变性,即:即:F(Z(x1),Z(x2),Z(xn)=F(Z(x1+h),Z(x2+h),Z(xn+h)实际应用中,满足这种位移不变的联合概率分布的区实际应用中,满足这种位移不变的联合概率分布的区域化随机变量较少见,而域化随机变量较少见,而严格平稳性的验证非常困难严格平稳性的验证非常困难。相比较,相比较,容易满足和验证的是分
11、布参数容易满足和验证的是分布参数(矩矩)的平稳性的平稳性,即即弱平稳性假设弱平稳性假设。常用的弱平稳性假设包括二阶平稳性和内蕴性假设。常用的弱平稳性假设包括二阶平稳性和内蕴性假设。二阶平稳性是比内蕴性更严格的若二阶平稳性是比内蕴性更严格的若(弱弱)平稳性假设。平稳性假设。14变异函数(区域化变量的定义和平稳性假设)变异函数(区域化变量的定义和平稳性假设)定义:如果区域化变量定义:如果区域化变量Z(x)满足下列两个条件,则称满足下列两个条件,则称其满足其满足二阶平稳性假设二阶平稳性假设。(1)在研究范围内,区域化变量)在研究范围内,区域化变量Z(x)的的期望期望存在且存在且为常数,即为常数,即
12、EZ(x)=m(2)在研究范围内,区域化变量)在研究范围内,区域化变量Z(x)的的协方差函数协方差函数存在且为空间滞后存在且为空间滞后h的函数,与空间位置的函数,与空间位置x无关,即无关,即CovZ(x),Z(x+h)=EZ(x+h)-mZ(x)-m=EZ(x+h)Z(x)-m2=C(h)当当h=0时,条件时,条件(2)说明了说明了方差函数方差函数存在且为常数,存在且为常数,VarZ(x)=CovZ(x),Z(x)=EZ(x)-m2=C(0)15变异函数(区域化变量的定义和平稳性假设)变异函数(区域化变量的定义和平稳性假设)二阶平稳性假设二阶平稳性假设要求区域化变量的期望、协方差和方要求区域化
13、变量的期望、协方差和方差都存在,实际中区域化变量的先验期望可能不存在,差都存在,实际中区域化变量的先验期望可能不存在,但是变异函数存在。但是变异函数存在。定义在区域化变量相对增量上的变异函数具有比定义定义在区域化变量相对增量上的变异函数具有比定义在区域化变量绝对值上的协方差函数的条件更加宽松,在区域化变量绝对值上的协方差函数的条件更加宽松,变异函数的计算比协方差函数的计算更加容易。变异函数的计算比协方差函数的计算更加容易。协方差函数和变异函数为空间结构的对偶描述方式。协方差函数和变异函数为空间结构的对偶描述方式。对于区域化变量,对于区域化变量,协方差函数从相似角度来描述空间协方差函数从相似角度
14、来描述空间结构结构,变异函数则从差异角度描述空间结构变异函数则从差异角度描述空间结构。16变异函数(区域化变量的定义和平稳性假设)变异函数(区域化变量的定义和平稳性假设)定义:如果区域化变量定义:如果区域化变量Z(x)满足下列两个条件,则称满足下列两个条件,则称其满足其满足内蕴性假设内蕴性假设。(1)在研究范围内,区域化变量)在研究范围内,区域化变量Z(x)增量的期望为增量的期望为零,即零,即EZ(x+h)-Z(x)=0(2)在研究范围内,区域化变量)在研究范围内,区域化变量Z(x)增量的方差存增量的方差存在且为空间滞后在且为空间滞后h的函数,与空间位置的函数,与空间位置x无关,即无关,即Va
15、rZ(x+h)-Z(x)=EZ(x+h)-Z(x)-EZ(x+h)-Z(x)2=EZ(x+h)-Z(x)2=2(h)(h)表示区域化变量的变异函数或半方差函数表示区域化变量的变异函数或半方差函数。也将也将(h)称为半变异函数或半变差函数称为半变异函数或半变差函数。区域化变量增量的计算避免了期望的直接计算。变异区域化变量增量的计算避免了期望的直接计算。变异函数对区域化变量的期望的存在没有直接要求。函数对区域化变量的期望的存在没有直接要求。17)()()()()()(21)(2xZhxZExZhxZExZhxZVarhx变异函数的定义和非负定性条件变异函数的定义和非负定性条件定义:变异函数是区域化
16、变量空间结构的一种形式化表达,数学表示为两个随机变量Z(x)和Z(x+h)之间增量的方差的一半,1819进一步表达式变换为:变异函数的定义和非负定性条件变异函数的定义和非负定性条件n在协方差函数和变异函数中,如果空间滞后在协方差函数和变异函数中,如果空间滞后h以极坐标参考以极坐标参考系中的矢量表示,则该滞后矢量有模和方向两个特征量。系中的矢量表示,则该滞后矢量有模和方向两个特征量。n当协方差函数和变异函数仅为模值当协方差函数和变异函数仅为模值|h|的函数时,称其为的函数时,称其为各各向同性协方差函数和变异函数向同性协方差函数和变异函数。n当协方差函数和变异函数同时为模值当协方差函数和变异函数同
17、时为模值|h|和方向的函数时,和方向的函数时,称其为称其为各向异性协方差函数和变异函数各向异性协方差函数和变异函数。n协方差函数和变异函数的各向异性可以分解为协方差函数和变异函数的各向异性可以分解为几何各向异性几何各向异性和和带状各向异性带状各向异性。n变程随方向不同的各向异性称为变程随方向不同的各向异性称为几何各向异性几何各向异性。n不能通过伸缩比例变换为各向同性的各向异性称为不能通过伸缩比例变换为各向同性的各向异性称为带状各向带状各向异性异性。20变异函数的定义和非负定性条件变异函数的定义和非负定性条件n通常,把通常,把360度方向离散划分为几个大的方向组,在度方向离散划分为几个大的方向组
18、,在某一角度区间范围某一角度区间范围(角度容许范围角度容许范围)内不同方向的样本内不同方向的样本点点(对对)都用来计算该区间中心方向的变异函数值。都用来计算该区间中心方向的变异函数值。n类似地,可以进行空间滞后距离分组,在某一距离类似地,可以进行空间滞后距离分组,在某一距离区间范围区间范围(距离容许范围距离容许范围)内,不同距离的样本点内,不同距离的样本点(对对)都用来计算该区间中心距离的变异函数值。都用来计算该区间中心距离的变异函数值。21变异函数的定义和非负定性条件变异函数的定义和非负定性条件变异函数模型拟合及其评价变异函数模型拟合及其评价n理想上,变异函数值随着空间滞后理想上,变异函数值
19、随着空间滞后h的增大而单调增加。的增大而单调增加。22一种典型变异函数曲线(variography)图中的变异函数(h)具有三个参数a,C0,C0+C。a称为变程,是变异函数达到基台值时的空间滞后h,反映了数据空间自相关的最大距离。C0称为块金值,是空间滞后为0时的变异函数值,为测量误差和低于采样间距的随机变异的综合反映。当空间滞后h超过变程a时,变异函数(h)在一个极限值()附近摆动,这个极限值称为基台值C+C0。n通常,一个区域化变量的取值通常,一个区域化变量的取值z由大尺度趋势由大尺度趋势、微尺度空间、微尺度空间相关变异相关变异r和纯随机变异和纯随机变异 三部分构成,即三部分构成,即z=
20、+r+。n期望期望(或平均值或平均值)即是一种趋势表示。即是一种趋势表示。n微尺度空间相关变异微尺度空间相关变异r为去除趋势后具有内在空间为去除趋势后具有内在空间(自自)相关性相关性的残余值的残余值n纯随机变异纯随机变异 为不存在空间为不存在空间(自自)相关性的独立噪声相关性的独立噪声(如测量误差如测量误差)。n测量误差和采样间距测量误差和采样间距(采样尺度采样尺度)以下的微尺度空间相关残余以下的微尺度空间相关残余值一起构成金块值值一起构成金块值C0。n采样间距采样间距(采样尺度采样尺度)以上的微尺度空间相关残余值的变异函以上的微尺度空间相关残余值的变异函数值为数值为C。23变异函数模型拟合及
21、其评价变异函数模型拟合及其评价n按照二阶平稳性或内蕴平稳性假设下的变异函数表达式按照二阶平稳性或内蕴平稳性假设下的变异函数表达式(h),计算,计算h=0时的变异函数值应该为时的变异函数值应该为0,表示同一位置点的样本,表示同一位置点的样本值没有差异,然而,这种值没有差异,然而,这种(0)=0的情形是在没有测量误差和的情形是在没有测量误差和采样间距采样间距(采样尺度采样尺度)以下空间以下空间(自自)相关变异的理想结果。相关变异的理想结果。n实际应用中,测量误差总是无法避免,采样间距总是掩盖了实际应用中,测量误差总是无法避免,采样间距总是掩盖了一些更小尺度的空间变异。一些更小尺度的空间变异。n尽管
22、带有块金值的变异函数模型失去了理想变异函数模型在尽管带有块金值的变异函数模型失去了理想变异函数模型在原点处的连续性,但是该模型合理地模拟了实际变异原点处的连续性,但是该模型合理地模拟了实际变异(测量误测量误差和小于采样间距尺度下的空间变异差和小于采样间距尺度下的空间变异),所以能更好地提高后,所以能更好地提高后续克里金估计的精度。续克里金估计的精度。24变异函数模型拟合及其评价变异函数模型拟合及其评价n理论变异函数模型的构建理论变异函数模型的构建是一项基础性研究,原则上满足条是一项基础性研究,原则上满足条件非负定性件非负定性(或非负定性或非负定性)的函数都可以作为候选的有效变异的函数都可以作为
23、候选的有效变异函数函数(有效协方差函数有效协方差函数)。n多年多年的研究和实践中,人们发展了一些标准的理论变异函数的研究和实践中,人们发展了一些标准的理论变异函数模型模型。n通过通过计算样本数据中不同空间滞后计算样本数据中不同空间滞后h上的变异函数值,对若上的变异函数值,对若干空间滞后干空间滞后h及其相应的变异函数值及其相应的变异函数值(经验变异函数模型经验变异函数模型)进行进行选定理论变异函数模型的拟合,确定理论模型中的参数值,选定理论变异函数模型的拟合,确定理论模型中的参数值,最终获取确定的变异函数模型。最终获取确定的变异函数模型。n在经验变异函数值到理论变异函数模型的拟合中,首先将理在经
24、验变异函数值到理论变异函数模型的拟合中,首先将理论变异函数模型通过变量代换建立对应的多项式回归方程,论变异函数模型通过变量代换建立对应的多项式回归方程,使用最小二乘法等方法进行最优参数估计,把解出的多项式使用最小二乘法等方法进行最优参数估计,把解出的多项式回归方程系数通过逆代换获得变异函数拟合模型的参数值。回归方程系数通过逆代换获得变异函数拟合模型的参数值。25变异函数模型拟合及其评价变异函数模型拟合及其评价26变异函数模型拟合及其评价变异函数模型拟合及其评价27变异函数模型拟合及其评价变异函数模型拟合及其评价28理论变异函数模型对样本数据的拟合中,样本数据容量有限性和关系复杂性与理论模型高度
25、简化性等要求我们对求得的回归模型的显著性进行检验,对不同理论模型拟合质量进行评价。最小二乘法原理求解回归方程系数时要求数据点和回归曲线之间的残差平方和最小。变异函数模型拟合及其评价变异函数模型拟合及其评价29变异函数模型拟合及其评价变异函数模型拟合及其评价n总离差平方和一定时,回归平方和越大,残差平方总离差平方和一定时,回归平方和越大,残差平方和就越小,判定系数就越大。和就越小,判定系数就越大。n判定系数的取值范围为判定系数的取值范围为0 R2 1。n当全部观测值都位于回归曲线上时,当全部观测值都位于回归曲线上时,SSE=0,则,则R2=1,说明总离差完全可以由所估计的样本曲线来,说明总离差完
展开阅读全文