书签 分享 收藏 举报 版权申诉 / 83
上传文档赚钱

类型空间数据仓库与数据挖掘课件.ppt

  • 上传人(卖家):三亚风情
  • 文档编号:3302942
  • 上传时间:2022-08-18
  • 格式:PPT
  • 页数:83
  • 大小:1.53MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《空间数据仓库与数据挖掘课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    空间 数据仓库 数据 挖掘 课件
    资源描述:

    1、第第10章章_空间数据仓库与空间数据仓库与数据挖掘数据挖掘2022-8-15第10章空间数据仓库与数据挖掘第1页,共83页。第十章第十章空间数据仓库空间数据仓库和数据挖掘和数据挖掘第10章空间数据仓库与数据挖掘第2页,共83页。数据仓库和空间数据仓库数据仓库和空间数据仓库 空间信息基础设施空间信息基础设施 数据挖掘和空间数据挖掘数据挖掘和空间数据挖掘 主要内容:第10章空间数据仓库与数据挖掘第3页,共83页。10.1 10.1 数据仓数据仓库与空间数据库与空间数据仓库仓库 数据仓库数据仓库 空间数据仓库空间数据仓库第10章空间数据仓库与数据挖掘第4页,共83页。10.1 10.1 数据仓库与空

    2、间数据仓库数据仓库与空间数据仓库 随着市场竞争的加剧和信息社会需求的发展,出现了随着市场竞争的加剧和信息社会需求的发展,出现了数数据集中化据集中化、业务综合化业务综合化、决策科学化决策科学化的趋势。伴随这种的趋势。伴随这种数据信息化的趋势,从大量数据中提取数据信息化的趋势,从大量数据中提取(检索、查询等检索、查询等)制制定市场策略的信息就显得越来越重要了。这种需求既要求定市场策略的信息就显得越来越重要了。这种需求既要求联机服务,又涉及大量用于决策的数据,而传统的数据库联机服务,又涉及大量用于决策的数据,而传统的数据库系统已无法满足这种需求。系统已无法满足这种需求。一、数据仓库一、数据仓库第10

    3、章空间数据仓库与数据挖掘第5页,共83页。历史数据量很大;历史数据量很大;辅助决策信息涉及许多部门的数据,而不同系统的辅助决策信息涉及许多部门的数据,而不同系统的数据难以集成;数据难以集成;由于访问数据的能力不足,它对大量数据的访问性由于访问数据的能力不足,它对大量数据的访问性能明显下降。能明显下降。10.1 10.1 数据仓库与空间数据仓数据仓库与空间数据仓库库一、数据仓库一、数据仓库无法满足的需求具体体现在三个方面:无法满足的需求具体体现在三个方面:第10章空间数据仓库与数据挖掘第6页,共83页。随着随着C/SC/S技术的成熟和并行数据库的发展,信息处技术的成熟和并行数据库的发展,信息处理

    4、技术的发展趋势是从大量的事务数据库中抽取数据,并理技术的发展趋势是从大量的事务数据库中抽取数据,并将其清理、转换为新的存储格式,即为决策目标把数据聚将其清理、转换为新的存储格式,即为决策目标把数据聚合在一种特殊的格式中。随着此过程的发展和完善,这种合在一种特殊的格式中。随着此过程的发展和完善,这种支持决策的、特殊的数据存储即被称为数据仓库支持决策的、特殊的数据存储即被称为数据仓库(Data(Data WarehouseWarehouse,DW)DW)。v 数据仓库产生趋势数据仓库产生趋势10.1 10.1 数据仓库与空间数据仓数据仓库与空间数据仓库库第10章空间数据仓库与数据挖掘第7页,共83

    5、页。数据仓库数据仓库(Data Warehouse,(Data Warehouse,简称简称DW)DW)是是支持管支持管理决策过程的理决策过程的、面向主题的面向主题的、集成的集成的、稳定的稳定的、不同不同时间的时间的数据集合。数据集合。主题是数据归类的标准,每个主题对应一个客观分析主题是数据归类的标准,每个主题对应一个客观分析领域,如客户、商店等,它可为辅助决策集成多个部领域,如客户、商店等,它可为辅助决策集成多个部门不同系统的大量数据。门不同系统的大量数据。数据仓库包含了大量历史数据,经集成后进入数据仓库的数据仓库包含了大量历史数据,经集成后进入数据仓库的数据是极少更新的。数据仓库内的数据时

    6、限为数据是极少更新的。数据仓库内的数据时限为5 5至至1010年,年,主要用于进行时间趋势分析。主要用于进行时间趋势分析。v 数据仓库定义数据仓库定义10.1 10.1 数据仓库与空间数据仓数据仓库与空间数据仓库库第10章空间数据仓库与数据挖掘第8页,共83页。数据仓库的数据量很大,一般为数据仓库的数据量很大,一般为10GB10GB左右。它左右。它是一般数据库是一般数据库 (100MB)(100MB)数据量的数据量的100100倍,大型数倍,大型数据仓库达到据仓库达到TBTB级。级。v 数据仓库定义数据仓库定义10.1 10.1 数据仓库与空间数据数据仓库与空间数据仓库仓库 数据仓库是一种分析

    7、型环境,它与一般的数据仓库是一种分析型环境,它与一般的DBMSDBMS的操的操作型环境是不同的,两者的比较有利于对数据仓库的理解作型环境是不同的,两者的比较有利于对数据仓库的理解。第10章空间数据仓库与数据挖掘第9页,共83页。10.1 10.1 数据仓库与空间数据仓数据仓库与空间数据仓库库数据仓库(数据仓库(DWDW)数据库(数据库(DBDB)分析型数据环境分析型数据环境操作型数据环境操作型数据环境面向分析(主题),支持面向分析(主题),支持DSSDSS面向业务,日常事务处理面向业务,日常事务处理集成的综合数据集成的综合数据非集成或者集成程度很低,非集成或者集成程度很低,主要是明细数据主要是

    8、明细数据历史数据(历史数据(5-105-10年)年)主要关心当前数据(主要关心当前数据(60-9060-90天)天)定期加载,加载后极少更新定期加载,加载后极少更新实时更新实时更新数据驱动的开发周期数据驱动的开发周期(CLDSCLDS)需求驱动的开发周期需求驱动的开发周期(SDLCSDLC)第10章空间数据仓库与数据挖掘第10页,共83页。数据仓库主要应用在两个方面:数据仓库主要应用在两个方面:使用浏览分析工具在使用浏览分析工具在DWDW中寻找有用的信息。中寻找有用的信息。数据仓库系统支持在数据仓库系统支持在DWDW上的应用,形成决策支持上的应用,形成决策支持系统系统 (DSS)(DSS)。v

    9、 数据仓库应用数据仓库应用10.1 10.1 数据仓库与空间数据数据仓库与空间数据仓库仓库第10章空间数据仓库与数据挖掘第11页,共83页。地球是一个复杂多变的系统,传统地学的各个学科由于自身的局地球是一个复杂多变的系统,传统地学的各个学科由于自身的局限,其研究范围已无法适应全球变化和区域可持续发展的要求。限,其研究范围已无法适应全球变化和区域可持续发展的要求。如在交通规划中,往往需要使用大量历史的、现实的空间数据以如在交通规划中,往往需要使用大量历史的、现实的空间数据以及各应用领域的复杂数据进行数据分析,涉及多维数据视图的概及各应用领域的复杂数据进行数据分析,涉及多维数据视图的概念,仅靠关系

    10、数据库就将难以解决。念,仅靠关系数据库就将难以解决。同时,传统的同时,传统的GISGIS应用系统是面向应用、事务驱动的,其中分应用系统是面向应用、事务驱动的,其中分析所需要的主题相当分散,不同的操作平台和数据标准使得析所需要的主题相当分散,不同的操作平台和数据标准使得决策支持系统几乎无法实现数据共享。为此,必须通过大型决策支持系统几乎无法实现数据共享。为此,必须通过大型的、多维化的数据库系统进行统一的组织、管理的、多维化的数据库系统进行统一的组织、管理 。二、空间数据仓库二、空间数据仓库10.1 10.1 数据仓库与空间数据数据仓库与空间数据仓库仓库v 空间数据仓库的产生趋势空间数据仓库的产生

    11、趋势第10章空间数据仓库与数据挖掘第12页,共83页。数据仓库正是这样一种数据的存储系统,它提供了来自数据仓库正是这样一种数据的存储系统,它提供了来自异地、异构、种类不同异地、异构、种类不同的应用系统的集成化和历史化的数据。的应用系统的集成化和历史化的数据。对其加工后,在数据仓库中存储、提取和维护,灵活地重对其加工后,在数据仓库中存储、提取和维护,灵活地重组数据,呈现出多维数据视图,并且面向复杂的数据分析组数据,呈现出多维数据视图,并且面向复杂的数据分析及高层的决策支持,从而为有关部门或企业进行全局范围及高层的决策支持,从而为有关部门或企业进行全局范围的多维分析、战略决策和长期趋势分析提供了有

    12、效的支持。的多维分析、战略决策和长期趋势分析提供了有效的支持。由于空间数据的特殊性,空间数据仓库在数据仓库由于空间数据的特殊性,空间数据仓库在数据仓库的基础上需引入空间维数据,根据主题从不同的的基础上需引入空间维数据,根据主题从不同的GISGIS应用应用系统中截取从瞬态到区段直至全球系统上的信息,从而提系统中截取从瞬态到区段直至全球系统上的信息,从而提供最好的信息服务。供最好的信息服务。v 空间数据仓库的产生趋势空间数据仓库的产生趋势10.1 10.1 数据仓库与空间数据仓数据仓库与空间数据仓库库第10章空间数据仓库与数据挖掘第13页,共83页。空间数据仓库(空间数据仓库(Spatial Da

    13、ta WarehouseSpatial Data Warehouse,简称,简称SDWSDW)是)是集成的集成的、面向主题的面向主题的、相对稳定的相对稳定的、反映时反映时间变化和地理空间变化的间变化和地理空间变化的空间数据存储,以支持各级管空间数据存储,以支持各级管理人员基于空间数据的分析和决策。理人员基于空间数据的分析和决策。v 空间数据仓库的概念和内涵空间数据仓库的概念和内涵10.1 10.1 数据仓库与空间数据仓数据仓库与空间数据仓库库第10章空间数据仓库与数据挖掘第14页,共83页。空间数据仓库是空间数据仓库是GISGIS、空间数据库与数据仓库技术相、空间数据库与数据仓库技术相结合的产

    14、物结合的产物,它在普通数据仓库基础上,引入空间数据,增,它在普通数据仓库基础上,引入空间数据,增加对空间数据的存贮、管理和分析能力,根据主题从不同的加对空间数据的存贮、管理和分析能力,根据主题从不同的空间数据源中截取不同规模的时空尺度上的信息,从而为地空间数据源中截取不同规模的时空尺度上的信息,从而为地学研究以及有关资源环境政策的制定等空间决策支持过程提学研究以及有关资源环境政策的制定等空间决策支持过程提供最好的信息服务。供最好的信息服务。空间数据仓库是数据仓库与空间处理分析空间数据仓库是数据仓库与空间处理分析的综合,具有空间,时间和主题的高度集成的综合,具有空间,时间和主题的高度集成。从信息

    15、科学的角度。从信息科学的角度来说,它是对数据仓库加进了非结构化信息处理。来说,它是对数据仓库加进了非结构化信息处理。v 空间数据仓库的概念和内涵空间数据仓库的概念和内涵10.1 10.1 数据仓库与空间数据仓数据仓库与空间数据仓库库第10章空间数据仓库与数据挖掘第15页,共83页。SDWSDW支持多种数据源支持多种数据源:数据库、数据文件、应:数据库、数据文件、应用程序等;用程序等;SDWSDW中存放的不仅是供使用的数据,还有在一中存放的不仅是供使用的数据,还有在一定激发条件下能主动其作用的定激发条件下能主动其作用的处理规则、算法,处理规则、算法,甚至是过程甚至是过程等;等;SDWSDW中数据

    16、并不完全是原始数据的简单归并和中数据并不完全是原始数据的简单归并和搬家,而是增值和统一,因此,搬家,而是增值和统一,因此,“汇总并统一汇总并统一”是一种可取的描述;是一种可取的描述;v 空间数据仓库的概念和内涵空间数据仓库的概念和内涵10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库第10章空间数据仓库与数据挖掘第16页,共83页。数据的集成化数据的集成化表明数据在结构上具有综合性,并且在语言上表明数据在结构上具有综合性,并且在语言上是异构的,在进入是异构的,在进入SDWSDW之前,必须经过加工和集成,这是之前,必须经过加工和集成,这是SDWSDW建设中最关键,最复杂的一步;建设

    17、中最关键,最复杂的一步;历史化表明历史化表明它可以截取不同时间尺度上的信息,从瞬它可以截取不同时间尺度上的信息,从瞬态到区段直到全体。态到区段直到全体。SDWSDW以时间为基准管理(积累,以时间为基准管理(积累,使用并处理)数据,即使依赖与时间维的数据结构;使用并处理)数据,即使依赖与时间维的数据结构;SDWSDW保存和管理的是保存和管理的是“对象对象”数据以及与之相关的数据以及与之相关的处理规则,算法和过程等的统一体,它们在处理规则,算法和过程等的统一体,它们在SDWSDW中以中以打包及有序存放的形式被保存和维护,且需要即可使用。打包及有序存放的形式被保存和维护,且需要即可使用。v 空间数据

    18、仓库的概念和内涵空间数据仓库的概念和内涵10.1 10.1 数据仓库与空间数据仓数据仓库与空间数据仓库库第10章空间数据仓库与数据挖掘第17页,共83页。v 空空间间数数据据仓仓库库的的体体系系结结构构10.1 10.1 数据仓库与空间数据仓数据仓库与空间数据仓库库空间数据仓库应用(空间决策支持系统等)空间数据仓库应用(空间决策支持系统等)分析结果分析结果联机分析处理联机分析处理数据挖掘数据挖掘数据仓库中信息数据仓库中信息多级存储策略多级存储策略数据库数据库空间数据库系统(数据管理部分)空间数据库系统(数据管理部分)SDBSDBSDB数据采集与输入系统(数据源部分)数据采集与输入系统(数据源部

    19、分)核心核心GIS数据数据政府统计政府统计数据数据市场经济市场经济数据数据土地利用土地利用数据数据分析工具分析工具数据转换数据转换数据输入数据输入决策运算决策运算MBKB空空间间数数据据仓仓库库第10章空间数据仓库与数据挖掘第18页,共83页。空间数据仓库机制的研究围绕空间数据仓库的实际应用空间数据仓库机制的研究围绕空间数据仓库的实际应用需求,探索空间数据仓库的关键技术。需求,探索空间数据仓库的关键技术。(1 1)支持空间信息的空间数据仓库模型:)支持空间信息的空间数据仓库模型:空间数据仓库空间数据仓库的数据模型是普通数据仓库的数据模型的有效扩充,必的数据模型是普通数据仓库的数据模型的有效扩充

    20、,必须针对空间信息的特点,对星型模型和雪花模型进行扩须针对空间信息的特点,对星型模型和雪花模型进行扩展。展。(2 2)支持空间数据导航的元数据机制:)支持空间数据导航的元数据机制:空间数据仓库的元空间数据仓库的元数据是人们定义空间数据仓库模型、理解空间数据意义数据是人们定义空间数据仓库模型、理解空间数据意义的重要窗口,空间数据仓库的元数据必须支持对空间数的重要窗口,空间数据仓库的元数据必须支持对空间数据分析的导航。据分析的导航。v 空间数据仓库的关键技术空间数据仓库的关键技术10.1 10.1 数据仓库与空间数据仓数据仓库与空间数据仓库库第10章空间数据仓库与数据挖掘第19页,共83页。(3

    21、3)面向海量空间信息的数据存储策略:)面向海量空间信息的数据存储策略:空间数据空间数据仓库包含海量的空间信息。支持对海量空间信息仓库包含海量的空间信息。支持对海量空间信息的高效的存储和检索是空间数据仓库的重要需求,的高效的存储和检索是空间数据仓库的重要需求,也是空间数据仓库的重要特征。因此需要研究面也是空间数据仓库的重要特征。因此需要研究面向海量空间信息的数据存储策略。向海量空间信息的数据存储策略。(4 4)面向海量空间信息高效检索的空间索引机制:)面向海量空间信息高效检索的空间索引机制:数据索引是提高数据检索效率的有效途径。由于空间数数据索引是提高数据检索效率的有效途径。由于空间数据仓库中涉

    22、及海量的空间信息,因此需要研究面向空间据仓库中涉及海量的空间信息,因此需要研究面向空间数据仓库的索引机制。数据仓库的索引机制。v 空间数据仓库的关键技术空间数据仓库的关键技术10.1 10.1 数据仓库与空间数据仓数据仓库与空间数据仓库库第10章空间数据仓库与数据挖掘第20页,共83页。(5 5)大规模空间数据处理:)大规模空间数据处理:由于空间数据所包含的数由于空间数据所包含的数据量比较大,当空间数据仓库中地理数据、元数据以及历据量比较大,当空间数据仓库中地理数据、元数据以及历史数据的数据量急速增长时数据的存储和管理机制的调整史数据的数据量急速增长时数据的存储和管理机制的调整策略等问题需要更

    23、加深入的研究。策略等问题需要更加深入的研究。(6 6)查询的建立和数据导航技术:)查询的建立和数据导航技术:空间数据的查询通常比空间数据的查询通常比较复杂,而目前的用户界面形式很难满足。必须为空间数据较复杂,而目前的用户界面形式很难满足。必须为空间数据仓库数据查询的输入以及数据查询的建立提供一套合适的机仓库数据查询的输入以及数据查询的建立提供一套合适的机制。制。(7 7)快速计算、高速网络、空间数据库的无缝连接、数据)快速计算、高速网络、空间数据库的无缝连接、数据挖掘、空间数据联机分析和处理及服务的互操作等关键技术。挖掘、空间数据联机分析和处理及服务的互操作等关键技术。v 空间数据仓库的关键技

    24、术空间数据仓库的关键技术10.1 10.1 数据仓库与空间数据仓数据仓库与空间数据仓库库第10章空间数据仓库与数据挖掘第21页,共83页。目前国外数据仓库以及空间数据仓库方面的主要工作基础有目前国外数据仓库以及空间数据仓库方面的主要工作基础有很多。很多。StanfordStanford大学的数据仓库大学的数据仓库WHIPS(WareHouse WHIPS(WareHouse Information Project at Stanford)Information Project at Stanford);美国正在启动一个空间信;美国正在启动一个空间信息处理项目息处理项目EOS(Earth Ove

    25、rview System)EOS(Earth Overview System),到,到20032003年,对全年,对全球地面监测的精度将达到球地面监测的精度将达到1 1米的分辨率,该项目对巩固美国在全米的分辨率,该项目对巩固美国在全球的竞争优势具有重要的作用。该项目的主要组成部分之一就是球的竞争优势具有重要的作用。该项目的主要组成部分之一就是空间数据的联机分析与挖掘技术的研究;空间数据的联机分析与挖掘技术的研究;IBMIBM的的AlmendenAlmenden实验实验室、北美和德国的一些公司、和科研机构的实验室在这个领域的室、北美和德国的一些公司、和科研机构的实验室在这个领域的研究中处于领先位

    26、置。研究中处于领先位置。v 国内外研究现状国内外研究现状10.1 10.1 数据仓库与空间数据仓数据仓库与空间数据仓库库第10章空间数据仓库与数据挖掘第22页,共83页。目前的空间数据仓库原型系统主要有目前的空间数据仓库原型系统主要有 :AMicrosoft AMicrosoft TerraServer TerraServer(由(由Jim GrayJim Gray主持主持 ),),GeoMinerGeoMiner(由加拿大(由加拿大Simon FraserSimon Fraser大学开发)等。大学开发)等。在国内,国家在国内,国家“九五九五”科技重点攻关项目科技重点攻关项目“空间空间信息共享

    27、和处理技术研究信息共享和处理技术研究”专题项目已取得阶段成果,专题项目已取得阶段成果,提出了空间信息共享系统设计方案。视觉与听觉信息处提出了空间信息共享系统设计方案。视觉与听觉信息处理国家重点实验室开放课题基金项目理国家重点实验室开放课题基金项目“空间数据联机分空间数据联机分析与空间数据挖掘研究析与空间数据挖掘研究”,该项目重点对空间数据联机,该项目重点对空间数据联机分析与空间数据挖掘及底层的空间数据仓库技术作基础分析与空间数据挖掘及底层的空间数据仓库技术作基础理论研究。理论研究。v 国内外研究现状国内外研究现状10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库第10章空间数据仓

    28、库与数据挖掘第23页,共83页。(1 1)空间数据仓库模型的研究)空间数据仓库模型的研究:空间数据面向主题的集成的:空间数据面向主题的集成的一个关键步骤是空间数据仓库的建模。空间数据仓库的逻辑一个关键步骤是空间数据仓库的建模。空间数据仓库的逻辑模型与普通数据仓库模型一样,通常采用类似的多维模型。模型与普通数据仓库模型一样,通常采用类似的多维模型。普通数据仓库模型通常采用星型模型或雪花模型。与普通数普通数据仓库模型通常采用星型模型或雪花模型。与普通数据仓库模型相比,空间数据仓库要管理复杂的空间数据类型,据仓库模型相比,空间数据仓库要管理复杂的空间数据类型,其维和度量中不仅可以包含简单数据类型的数

    29、据,同时也可其维和度量中不仅可以包含简单数据类型的数据,同时也可以包含空间对象。由于空间对象占用的存储空间较大,其操以包含空间对象。由于空间对象占用的存储空间较大,其操作也比较复杂,这就需要扩充维和度量的定义,以便更有效作也比较复杂,这就需要扩充维和度量的定义,以便更有效地处理这样的维和度量。地处理这样的维和度量。v 目前空间数据仓库主要研究内容目前空间数据仓库主要研究内容10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库第10章空间数据仓库与数据挖掘第24页,共83页。(2 2)海量空间数据的存储:)海量空间数据的存储:空间数据仓库通常以空间数据仓库通常以空间数据库为基础,由于

    30、空间数据仓库涉及海量的空间空间数据库为基础,由于空间数据仓库涉及海量的空间信息,同时空间信息计算耗费的资源较多,确定空间信信息,同时空间信息计算耗费的资源较多,确定空间信息的合理存储策略(如数据分片等),以便计算和显示,息的合理存储策略(如数据分片等),以便计算和显示,也是当前许多专家关注的焦点。也是当前许多专家关注的焦点。v 目前空间数据仓库主要研究内容目前空间数据仓库主要研究内容10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库第10章空间数据仓库与数据挖掘第25页,共83页。(3 3)异构空间数据源的有效集成:)异构空间数据源的有效集成:空间数据仓空间数据仓库所要集成的数据

    31、分布于各个企业或各个政府部门,库所要集成的数据分布于各个企业或各个政府部门,这些数据源通常具有不同的数据格式;此外,空间这些数据源通常具有不同的数据格式;此外,空间数据的表示、存储和访问方式目前还没有统一的标数据的表示、存储和访问方式目前还没有统一的标准,空间数据的语义也往往比较复杂。这就给空间准,空间数据的语义也往往比较复杂。这就给空间数据的集成和共享带来了极大的困难,如何实现空数据的集成和共享带来了极大的困难,如何实现空间数据的有效集成是国内外空间数据仓库工程的一间数据的有效集成是国内外空间数据仓库工程的一个重点和难点。个重点和难点。v 目前空间数据仓库主要研究内容目前空间数据仓库主要研究

    32、内容10.1 10.1 数据仓库与空间数据数据仓库与空间数据仓库仓库第10章空间数据仓库与数据挖掘第26页,共83页。(4 4)空间数据仓库的索引机制:)空间数据仓库的索引机制:空间数据库的索引空间数据库的索引方法主要包括:方法主要包括:z-z-序索引、四叉树索引、序索引、四叉树索引、kd-kd-树索引、树索引、R R树索引、树索引、R+R+树索引等。由于空间数据仓库中的数据具树索引等。由于空间数据仓库中的数据具有海量的、极少更新的、随时间变化的特点,其主要的有海量的、极少更新的、随时间变化的特点,其主要的操作是数据的追加和查询,因此要求针对空间数据仓库操作是数据的追加和查询,因此要求针对空间

    33、数据仓库的特点设计更加合适的空间数据仓库索引机制是空间数的特点设计更加合适的空间数据仓库索引机制是空间数据仓库机制的重要组成部分,也是目前许多专家关注的据仓库机制的重要组成部分,也是目前许多专家关注的焦点。焦点。v 目前空间数据仓库主要研究内容目前空间数据仓库主要研究内容10.1 10.1 数据仓库与空间数据仓数据仓库与空间数据仓库库第10章空间数据仓库与数据挖掘第27页,共83页。(5)(5)空间数据仓库元数据机制:空间数据仓库元数据机制:空间数据仓库的元数据是确定空间数据仓库的元数据是确定空间数据仓库的逻辑结构、存储策略的重要组成部分。空间数据仓库的逻辑结构、存储策略的重要组成部分。从数据

    34、从数据仓库建设者的角度仓库建设者的角度来看,空间数据仓库元数据是数据仓库的描述,来看,空间数据仓库元数据是数据仓库的描述,是关于数据加载方法和数据加载频率、数据存储和应用的描述信息。是关于数据加载方法和数据加载频率、数据存储和应用的描述信息。从用户的角度来看从用户的角度来看,它是用户理解和使用数据仓库的向导。,它是用户理解和使用数据仓库的向导。空间数据仓库元数据的主要内容包括:数据仓库的描述空间数据仓库元数据的主要内容包括:数据仓库的描述信息、数据仓库的信息源描述、数据转换方法描述信息、数信息、数据仓库的信息源描述、数据转换方法描述信息、数据加载方法的描述信息、业务术语的定义、业务处理的规则据

    35、加载方法的描述信息、业务术语的定义、业务处理的规则的描述信息。因此要求建立合理的空间数据仓库元数据的机的描述信息。因此要求建立合理的空间数据仓库元数据的机制,确保空间数据仓库的合理性和高可用性。制,确保空间数据仓库的合理性和高可用性。v 目前空间数据仓库主要研究内容目前空间数据仓库主要研究内容10.1 10.1 数据仓库与空间数据仓数据仓库与空间数据仓库库第10章空间数据仓库与数据挖掘第28页,共83页。按照关系数据库之父按照关系数据库之父.Codd.Codd的定义,的定义,OLAPOLAP是是大量多维数据的动态综合(大量多维数据的动态综合(synthesissynthesis)、分析)、分析

    36、(analysisanalysis)与合并()与合并(consolidationconsolidation),它是能够),它是能够快速交互地,方便地获取它们所需信息的一些技术快速交互地,方便地获取它们所需信息的一些技术(多维数据分析,神经网络等)的综合,(多维数据分析,神经网络等)的综合,它通过快速、它通过快速、一致、交互地访问各种可能的信息,试图帮助数据分析一致、交互地访问各种可能的信息,试图帮助数据分析人员、管理人员、决策者洞察数据显示,掌握隐藏其中人员、管理人员、决策者洞察数据显示,掌握隐藏其中地规律。地规律。v OLAP(联机处理分析联机处理分析)OLAP(Online Analysi

    37、s Processing)OLAP(Online Analysis Processing)的概念的概念10.1 10.1 数据仓库与空间数据数据仓库与空间数据仓库仓库第10章空间数据仓库与数据挖掘第29页,共83页。关于关于OLAPOLAP地详细定义,地详细定义,CoddCodd曾给出了十二条准则,其后,曾给出了十二条准则,其后,还对其进行了扩充。根据产品的实际应用情况和用户还对其进行了扩充。根据产品的实际应用情况和用户对产品的需求对产品的需求,人们提出了一种对更简单明确人们提出了一种对更简单明确的定义的定义,即即共享多维信息的快速分析共享多维信息的快速分析(Fast Analysis of(

    38、Fast Analysis of Shared Multidimensional InformationShared Multidimensional Information,简称,简称FASMI)FASMI)。目前,常见的目前,常见的OLAPOLAP有基于多维数据库的有基于多维数据库的MOLAPMOLAP(MultiMultidemention OLAPdemention OLAP)、基于关系数据库)、基于关系数据库ROLAP(Relation OLAP)ROLAP(Relation OLAP)以及混合的以及混合的HOLAPHOLAP(Hybrid Hybrid OLAPOLAP)。)。v

    39、OLAP(联机处理分析联机处理分析)OLAPOLAP的概念的概念10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库第10章空间数据仓库与数据挖掘第30页,共83页。OLTP OLTP和和OLAPOLAP有很大的差别有很大的差别,在传统的在传统的OLTPOLTP技术中,所依赖的是实体、联系、功能分技术中,所依赖的是实体、联系、功能分解、状态转换分析和事务处理等概念和方法;解、状态转换分析和事务处理等概念和方法;而在而在OLAPOLAP技术中,主要使用的是事实表、维表、技术中,主要使用的是事实表、维表、层次层次(hierarchies)(hierarchies)、稀疏性、稀疏性(sp

    40、arsity)(sparsity)、指标聚、指标聚集等概念和方法。集等概念和方法。OLAPOLAP与与OLTPOLTP的区别的区别v OLAP(联机处理分析联机处理分析)10.1 10.1 数据仓库与空间数据数据仓库与空间数据仓库仓库第10章空间数据仓库与数据挖掘第31页,共83页。OLAPOLAP与与OLTPOLTP的区别的区别v OLAP(联机处理分析联机处理分析)10.1 10.1 数据仓库与空间数据数据仓库与空间数据仓库仓库OLTPOLAP时间时间短时间框架短时间框架长时间框架长时间框架状态状态迅速变化的迅速变化的静态的静态的数据类型数据类型细节的、操作性数据细节的、操作性数据综合的、

    41、提炼的分析性数据综合的、提炼的分析性数据查询查询标准的事务标准的事务随机的、动态的查询随机的、动态的查询稳定性稳定性实时更新实时更新周期性刷新周期性刷新功能功能支持日常操作支持日常操作支持管理要求支持管理要求设计设计事件驱动面向应用事件驱动面向应用数据驱动面向分析数据驱动面向分析第10章空间数据仓库与数据挖掘第32页,共83页。多维空间数据模型多维空间数据模型 空间数据空间数据CubeCube的构造和维护的构造和维护 空间空间CubeCube数据的多维显示数据的多维显示 OLAPOLAP目前主要研究内容目前主要研究内容v OLAP(联机处理分析联机处理分析)10.1 10.1 数据仓库与空间数

    42、据仓库数据仓库与空间数据仓库第10章空间数据仓库与数据挖掘第33页,共83页。支持支持cubecube构造的多维数据存储模型;构造的多维数据存储模型;空间数据空间数据cubecube实例化视图选择方法研究;实例化视图选择方法研究;空间数据空间数据cubecube的构造算法;的构造算法;在二级存储中高效构造高维的在二级存储中高效构造高维的cubecube和空间数据和空间数据cubecube;OLAPOLAP关键技术关键技术v OLAP(联机处理分析联机处理分析)10.1 10.1 数据仓库与空间数据仓数据仓库与空间数据仓库库第10章空间数据仓库与数据挖掘第34页,共83页。空间数据仓库系统是引入

    43、数据仓库后的计算机空间数据仓库系统是引入数据仓库后的计算机系统。其目标是支持用户利用存储地信息进行分析、系统。其目标是支持用户利用存储地信息进行分析、处理和决策。处理和决策。空间数据仓库由四部分组成:数据、计算机硬件、空间数据仓库由四部分组成:数据、计算机硬件、软件、用户软件、用户 。v 空间数据仓库系统空间数据仓库系统10.1 10.1 数据仓库与空间数据仓数据仓库与空间数据仓库库第10章空间数据仓库与数据挖掘第35页,共83页。在操作上在操作上,GIS,GIS源数据由异构变为同构源数据由异构变为同构,消除了数据消除了数据模型及语法、语义的差异模型及语法、语义的差异,数据库可直接被数据库可直

    44、接被DBMSDBMS访问访问,加快了查询和分析处理的速度。访问仓库的加快了查询和分析处理的速度。访问仓库的数据不需要占用信息源的系统资源数据不需要占用信息源的系统资源,不会像直接访不会像直接访问信息源那样增加开销。问信息源那样增加开销。在功能上在功能上,除了便于管理、维护外除了便于管理、维护外,GIS,GIS空间数据仓库为空间数据仓库为其数据挖掘准备了条件。如果数据挖掘技术利用得当其数据挖掘准备了条件。如果数据挖掘技术利用得当,还可扩充还可扩充GISGIS的功能的功能,当然当然,数据仓库及其技术并未抛弃数据仓库及其技术并未抛弃关系型数据库和关系型数据库和DBMSDBMS的一系列功能。的一系列功

    45、能。v 使用空间数据仓库的优势使用空间数据仓库的优势10.1 10.1 数据仓库与空间数据仓数据仓库与空间数据仓库库第10章空间数据仓库与数据挖掘第36页,共83页。有望解决有望解决OPENGISOPENGIS在数据上不一致的问题。在数据上不一致的问题。具有明显的社会意义具有明显的社会意义,有利于加强商业、资源、环境等有利于加强商业、资源、环境等的宏观决策。可以说的宏观决策。可以说,数据仓库是伴随着数据仓库是伴随着C/SC/S技术和并技术和并行数据库的发展孕育而生的行数据库的发展孕育而生的,大型大型GISGIS要处理多源的、要处理多源的、多变量的、异构的、海量的地理数据多变量的、异构的、海量的

    46、地理数据,就要采用能解决就要采用能解决这些问题的技术。数据仓库技术可以解决其中的一些问这些问题的技术。数据仓库技术可以解决其中的一些问题。题。v GIS中使用空间数据仓库的优势中使用空间数据仓库的优势10.1 10.1 数据仓库与空间数据仓数据仓库与空间数据仓库库第10章空间数据仓库与数据挖掘第37页,共83页。空间数据粒度的划分;空间数据粒度的划分;空间数据的分割(面向图幅、面向图层、空间数据的分割(面向图幅、面向图层、面向面向专题要素专题要素 ););空间元数据的设计、管理及其标准化。空间元数据的设计、管理及其标准化。v 开发数据仓库应注意的问题开发数据仓库应注意的问题10.1 10.1

    47、数据仓库与空间数据仓数据仓库与空间数据仓库库第10章空间数据仓库与数据挖掘第38页,共83页。10.2 10.2 空间数据基空间数据基础设施础设施 空间信息基础设施的定义空间信息基础设施的定义 空间信息基础设施的目标空间信息基础设施的目标 空间信息基础设施组成空间信息基础设施组成 空间信息基础设施体系结构空间信息基础设施体系结构 NII&NSIINII&NSIISDW&NSIISDW&NSII 第10章空间数据仓库与数据挖掘第39页,共83页。美国于年颁布了总统行政令美国于年颁布了总统行政令,实施国家空间数据基实施国家空间数据基础设施计划。础设施计划。国家空间信息基础设施国家空间信息基础设施(

    48、National Spatial(National Spatial Information InfrastructureInformation Infrastructure,简称,简称)的定义的定义为为:“:“一个国家内描述地球上地理要素和现象的分布及其属性的一个国家内描述地球上地理要素和现象的分布及其属性的所有地理信息的组合所有地理信息的组合,以及对这些信息的获取、处理、存储、分以及对这些信息的获取、处理、存储、分发和提高使用所需的技术、政策、标准和人力资源发和提高使用所需的技术、政策、标准和人力资源”。是为使用、生产和管理与地理空间信息有关的社会各部门以是为使用、生产和管理与地理空间信息有

    49、关的社会各部门以及个人提供基础信息环境和支持及个人提供基础信息环境和支持,是国家信息基础设施的子集。是国家信息基础设施的子集。一、国家空间信息基础设施定义一、国家空间信息基础设施定义10.2 10.2 空间数据基础设施空间数据基础设施第10章空间数据仓库与数据挖掘第40页,共83页。在今天的信息社会和网络环境下在今天的信息社会和网络环境下,它是一个分布式异构它是一个分布式异构的地理空间信息资源网络。空间信息基础设施的体系结构是的地理空间信息资源网络。空间信息基础设施的体系结构是实施地理空间信息基础设施概念的逻辑模型。实施地理空间信息基础设施概念的逻辑模型。空间信息基础设施在区域层次上分为全球空

    50、间信空间信息基础设施在区域层次上分为全球空间信息基础设施息基础设施()、区域空间信息基础设施、区域空间信息基础设施()和国家空间信息基础设施(和国家空间信息基础设施(NSIINSII)。)。一、国家空间信息基础设施定义一、国家空间信息基础设施定义10.2 10.2 空间数据基础设施空间数据基础设施第10章空间数据仓库与数据挖掘第41页,共83页。空间信息具有区域性、综合性和共享性,空间信息具有区域性、综合性和共享性,NSIINSII旨旨在建立作为各部门共同使用的基础信息,避免部门重在建立作为各部门共同使用的基础信息,避免部门重复建设问题,提高信息标准化程度,为信息共享和网复建设问题,提高信息标

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:空间数据仓库与数据挖掘课件.ppt
    链接地址:https://www.163wenku.com/p-3302942.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库