书签 分享 收藏 举报 版权申诉 / 62
上传文档赚钱

类型数据挖掘在精选课件.ppt

  • 上传人(卖家):三亚风情
  • 文档编号:3325416
  • 上传时间:2022-08-20
  • 格式:PPT
  • 页数:62
  • 大小:1.19MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《数据挖掘在精选课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    数据 挖掘 精选 课件
    资源描述:

    1、2019-12数据挖掘在地震预测中的应用数据挖掘在地震预测中的应用 1、关联规则、关联规则 2、时间序列的相似性、时间序列的相似性 3、神经网络及其集成、神经网络及其集成 4、支持向量机、支持向量机 5、粗糙集、粗糙集 6、主成分分析、主成分分析 7、因子分析、因子分析 8、数据挖掘在地震领域中的应用研究展望、数据挖掘在地震领域中的应用研究展望 寻找地震相关地区,进而预报相关地震是人们较为熟悉寻找地震相关地区,进而预报相关地震是人们较为熟悉的地震预报方法之一的地震预报方法之一。提出提出基于主从模式设计的并行关联规则挖掘算法基于主从模式设计的并行关联规则挖掘算法 FPM-LP(Fast Para

    2、llel Mining of Local Pruning),以期实现高效发现地,以期实现高效发现地震相关地区的关联规则挖掘。震相关地区的关联规则挖掘。结果解释和说明:结果解释和说明:区域编号区域编号15711571:新疆乌孜别里山一带;:新疆乌孜别里山一带;区域编号区域编号10981098:云南丽江一带。:云南丽江一带。规则规则“157115711098”1098”的支持度为的支持度为40%40%,可信度为,可信度为60%60%,说明在,说明在19601960到到20192019的的400400多个月里,有大约多个月里,有大约40%40%的时间段,即的时间段,即160160多个月新疆和云南同时

    3、发多个月新疆和云南同时发生了地震。而新疆、云南相伴发生地震的可能性为生了地震。而新疆、云南相伴发生地震的可能性为60%60%。1571 1098 support=40%,confidence=60%在三种不同数在三种不同数据组合实验中,据组合实验中,每次的挖掘结果每次的挖掘结果都发现云南与新都发现云南与新疆之间的地震关疆之间的地震关联和新疆各地区联和新疆各地区之间的地震关联。之间的地震关联。经归纳,云南与经归纳,云南与新疆之间的地震新疆之间的地震关联大致如图中关联大致如图中所示,地震关联所示,地震关联地区用方框标明。地区用方框标明。事实上,从事实上,从19701970年到年到20192019年

    4、,两地区地震的年,两地区地震的M-TM-T图(震图(震级与时间关系图,其中级与时间关系图,其中M M为震级,为震级,T T为地震发生时间)如下:为地震发生时间)如下:每当新疆发生一次地震,在云南地区不超过每当新疆发生一次地震,在云南地区不超过1 1个月就会相伴个月就会相伴发生一次地震,从发生一次地震,从19701970年到年到20192019年都有这样的规律。年都有这样的规律。定义:设定义:设S和和R为两个不同的地震时间序列,则为两个不同的地震时间序列,则S和和R的相似性可用两序列中的相似性可用两序列中对应元素的相似性记分函数加权和来度量。对应元素的相似性记分函数加权和来度量。相似性度量模型相

    5、似性度量模型定义为:定义为:2 2 基于序列相似性的地震相关性分析基于序列相似性的地震相关性分析),(*),(),(|,|ax1iRiSWiRiSRSScoreRSmi这里,这里,(1)S和和R分别是在指定时间范围内对分别是在指定时间范围内对S和和R补充了空元素以后形成的补充了空元素以后形成的稠密地震序列。如果将稠密地震序列。如果将S和和R中的空元素除去后则还原为中的空元素除去后则还原为S和和R。(2)|S|=|R|;(即;(即S、R两序列长度相等)两序列长度相等)(3)W(x,y)是权重函数,定义为是权重函数,定义为:W(x,y)=maxx(t),y(t);如果;如果x(t)M 或者或者 y

    6、(t)M W(x,y)=minx(t),y(t);如果如果x(t)M 并且并且 y(t)M 实验实验1 1:固定时间差为:固定时间差为1 1年的粗粒度序列相似性分析年的粗粒度序列相似性分析选取选取1980年年1月月1日开始的日开始的5.0级级以上地震转换成时间序列,地以上地震转换成时间序列,地理位置按地理坐标进行理位置按地理坐标进行55分块,时间间隔为分块,时间间隔为1年年,=1,相关地震支持数阈值,相关地震支持数阈值Sup-min为为10。得到部分实验结果如。得到部分实验结果如下表所示:下表所示:thresholdM区域1经度范围纬度范围(度)区域2经度范围纬度范围(度)相关次数452100

    7、-10525-30492120-12520-251841490-9530-35492120-12520-251641595-10030-35492120-12520-251537575-8035-40492120-12520-2514452100-10525-3041490-9530-351341385-9030-35492120-12520-2513488100-10520-25492120-12520-2513452100-10525-3037575-8035-4012例,下图为区域例,下图为区域452(位置在四川位置在四川-云南境内,其经度范围云南境内,其经度范围100 105,纬度范围

    8、,纬度范围25 30)和区域和区域492(台湾省周围,其经度范围台湾省周围,其经度范围120 125,纬度范围为,纬度范围为20 25)相匹配的地区相关性分析相匹配的地区相关性分析M-T图。图。图中匹配的次数为图中匹配的次数为18次,即在四川次,即在四川云南境内的每一次云南境内的每一次5级以上级以上地震几乎都可以在台湾省周围找到与之匹配的一次地震记录。地震几乎都可以在台湾省周围找到与之匹配的一次地震记录。四 川 云 南 台 湾 省 区域 A经度(度)纬度(度)次数比例区域 B经度(度)纬度(度)次数比例相关数1182112112224259260.1391126010010127-282440

    9、.5291291201912112223246020.2041126010010127-282440.5041239077777839-404930.2251126010010127-282440.4551118897777840-416120.1671126010010127-282440.4181028942122-12340-415470.1831126010010127-282440.410100 实验实验2:较小时空窗口的细粒度序列相似性分析:较小时空窗口的细粒度序列相似性分析采用自采用自1972年年1月月1日开始的震级在日开始的震级在3.0以上的地震数据,用以上的地震数据,用WSM

    10、3S算法进行较小时空窗口的细粒度序列相似性分析。实验算法进行较小时空窗口的细粒度序列相似性分析。实验中具体参数为:地理位置按地理坐标进行中具体参数为:地理位置按地理坐标进行1 1 分块,时间间分块,时间间隔为隔为10天天,=1,地震相关支持数阈值,地震相关支持数阈值Sup-min为为100,无,无固定时间差。固定时间差。时间间隔为时间间隔为1010天的地区相关性比较实验结果天的地区相关性比较实验结果 以表以表3-33-3中第一条记录为例进行分析,算法发现块中第一条记录为例进行分析,算法发现块1182111821和块和块1126011260的地震相的地震相关次数为关次数为129129次,说明它们

    11、很可能是地震相关地区。次,说明它们很可能是地震相关地区。1182111821块处于我国台湾块处于我国台湾省台北市的下方,位于我国较大的一个地震频繁发生的地震带上,而省台北市的下方,位于我国较大的一个地震频繁发生的地震带上,而1126011260块处于云南和四川交界处,位于另一个地震带上。从块处于云南和四川交界处,位于另一个地震带上。从19801980年到年到19851985年这两年这两块区域中每月取一个块区域中每月取一个3 3级以上最大地震所得到的对应级以上最大地震所得到的对应M MT T图。图。台湾省台北市附近 云南和四川交界处 3.神经网络集成神经网络集成MEm/EPb值k值Mmax T2

    12、.01:主震-余震型2:震群型3:孤立型地震序列类型判断指标DOEERBF 提出了一种基于正交设计和均匀设计的异构提出了一种基于正交设计和均匀设计的异构RBF神经网络集成方法神经网络集成方法DOEERBF。3.1 地震序列类型判断地震序列类型判断比较实验和结果 单个RBFNN外推精度为68.33%,内符精度77.12%固定集成结构和训练参数外推精度65%,内符精度69.64%均匀设计确定集成结构和参数外推精度78.33%,内符精度81.36%提出了一种自动确定神经网络集成自动确定神经网络集成结构和参数调整的构造选择性结构和参数调整的构造选择性RBF神神经网络集成算法经网络集成算法CSERBF

    13、前兆及地震学异常的持续时间和种类多少与未来地震震级大小有一定关系 14项异常指标的持续时间+异常的数量未来地震震级CSERBF 3.2 地震震级预测地震震级预测震级预报3.3 基于特征加权的神经网络集成基于特征加权的神经网络集成 FWEART 地震序列类型判断中的应用 4.支持向量机支持向量机 SVM方法的基本思想:方法的基本思想:基于Mercer核展开定理,通过非线性映射,把样本空间映射到一个高维乃至于无穷维的特征空间,使得在特征空间中可以应用线性学习机的方法解决样本空间中的高度非线性分类分类和回归回归等问题。最优超平面的分类函数为最优超平面的分类函数为 )sgn()(1kiiiibyxfx

    14、x 4.1 我国大陆强震预测的支持向量机方法我国大陆强震预测的支持向量机方法 全球强震主要分布在环太平洋地震带和欧亚全球强震主要分布在环太平洋地震带和欧亚地震带。许多学者研究表明,我国大陆强震与全地震带。许多学者研究表明,我国大陆强震与全球主要板块边界的强震活动之间具有一定的关系,球主要板块边界的强震活动之间具有一定的关系,但是这种关系具有较强的非线性。但是这种关系具有较强的非线性。将板板块边界的强震活动分为将板板块边界的强震活动分为16个区域个区域,取取这这16个区域在一年中的个区域在一年中的Ms7.0级地震次数级地震次数Ni为支为支持向量机输入项;输出项为次年我国大陆是否发持向量机输入项;

    15、输出项为次年我国大陆是否发生生7级以上强震。如果发生,取值为级以上强震。如果发生,取值为1;否则为;否则为0。表1 使用支持向量机和BP神经网络对14个待检验样本的检验结果 预 测 年 份 1968 1969 1982 1983 1984 1985 1991 1992 1993 1994 2019 2019 2019 2019 中国大陆最大地震震级 5.7 7.4 6.6 6.8 6.2 7.4 6.5 6.9 6.6 7.3 8.1 5.9 6.8 6.7 检 验 结 果(SVM)0 0 0 0 0 1 0 0 0 1 1 0 1 0 检 验 结 果(BP)0 1 1 1 0 1 0 0 0

    16、 1 1 0 1 0 通过支持向量机对上述通过支持向量机对上述65个样本的学习,据此对学习个样本的学习,据此对学习样本的内符检验全部正确;对样本的内符检验全部正确;对14个待检验样本的检验结个待检验样本的检验结果果(表表1)表明,有表明,有12个样本的检验结果正确,两个报错个样本的检验结果正确,两个报错(1969、2019年),报准率为年),报准率为 1214=0.86。使用使用BP神经网络模型进行外推检验,报准率为神经网络模型进行外推检验,报准率为 1114=0.79。支持向量机的预测检验结果要优于。支持向量机的预测检验结果要优于BP神神经网络。经网络。4.2.1 地震时间序列预测方法(地震

    17、时间序列预测方法(1)依次取前13年中我国大陆每年的最大地震震级 Mi+1,Mi+2,Mi+13,预测第14年的我国大陆最大地震震级Mi+14,(i=1,2,m)。这样支持向量机的输入项为前13年中每年的最大地震 Mi+1,Mi+2,Mi+13;输出项为1个,即为第14年的我国大陆最大地震震级 Mi+14。4.2 中国大陆强震时间序列预测的支持向量机方法中国大陆强震时间序列预测的支持向量机方法表表1 预测方法()的预测样本检验结果预测方法()的预测样本检验结果 预预 测测 年年 份份 1991 1992 1993 1994 2019 2019 2019 2019 2019 2000 2019

    18、2019 2019 20191991 1992 1993 1994 2019 2019 2019 2019 2019 2000 2019 2019 2019 2019中国大陆最大中国大陆最大地震震级地震震级 6.5 6.9 6.6 7.3 7.3 7.1 7.5 6.6 7.0 6.5 8.1 7.2 6.8 6.76.5 6.9 6.6 7.3 7.3 7.1 7.5 6.6 7.0 6.5 8.1 7.2 6.8 6.7 检检 验验 结结 果果 7.0 7.2 6.9 6.9 7.3 6.7 7.1 7.0 7.2 6.9 6.9 7.3 6.7 7.1 7.57.5 6.9 7.0 6.

    19、9 7.0 6.9 6.9 7.0 6.8 7.0 7.0 6.8 7.0 预测与实际震预测与实际震级之差级之差-0.5-0.3-0.3 0.4 0.0 0.4 0.4-0.5-0.3-0.3 0.4 0.0 0.4 0.4-0.9-0.9 0.1-0.5 0.1-0.5 1.21.2 0.2 0.0-0.3 0.2 0.0-0.3 取预测与实际最大地震震级之差小于等于0.5为报准,则有12个样本的检验结果正确,2个报错。这样报准率为12/14=0.86。4.2.2 地震时间序列预测方法(地震时间序列预测方法(2)支持向量机的输入项为前13年中每年的最大地震震级 Mi+1,Mi+2,Mi+13

    20、。还增加8个输入项,它们分别是全球地震活动第12和13年的年频次,第13年的年释放能量,第12和13年与前一年的释放能量的差分值,第13年的太阳年平均黑子数,第12和13年与前一年的太阳黑子数差分值。这样支持向量机的输入项共为21个;输出项为1个,仍为所预测的我国大陆第14年的最大地震震级。表表2 预测方法(预测方法(2)的预测样本检验结果)的预测样本检验结果 预预 测测 年年 份份 1991 1992 1993 1994 2019 2019 2019 2019 2019 2000 2019 2019 2019 20191991 1992 1993 1994 2019 2019 2019 20

    21、19 2019 2000 2019 2019 2019 2019中国大陆最大中国大陆最大地震震级地震震级 6.5 6.9 6.6 7.3 7.3 7.1 7.5 6.6 7.0 6.5 8.1 7.2 6.8 6.76.5 6.9 6.6 7.3 7.3 7.1 7.5 6.6 7.0 6.5 8.1 7.2 6.8 6.7 检检 验验 结结 果果 7.0 7.0 6.9 7.0 7.0 7.0 7.0 7.0 6.9 7.0 7.0 7.0 6.9 7.0 7.0 7.0 7.0 7.0 6.9 7.0 7.07.0 7.0 7.0 6.9 7.0 7.0 6.9 预测与实际震预测与实际震级

    22、之差级之差-0.5-0.2-0.3 0.1 0.3 0.1 0.5-0.4 0.1-0.5 -0.5-0.2-0.3 0.1 0.3 0.1 0.5-0.4 0.1-0.5 1.11.1 0.2-0.2-0.2 0.2-0.2-0.2 取预测与实际最大地震震级之差小于等于0.5为报准,则有13个样本的检验结果正确,1个报错。这样报准率为13/14=0.93,支持向量机与神经网络预测方法预测检验结果比较方法1(SVM)方法1(神经网络)方法2(SVM)方法2(神经网络)报准率 12/14=0.869/11=0.8213/14=0.9310/11=0.91平均误差 0.400.450.340.43

    23、均方差 0.500.590.420.51 与神经网络预测方法比较,本文所用的支持向量机预测方法无论在报准率、预测的平均误差还是均方差这三个方面,都要优于神经网络方法。粗集粗集(Rough Set,或粗糙集或粗糙集)理论是近年来理论是近年来发展起来的发展起来的一种处理不确定和模糊信息的重一种处理不确定和模糊信息的重要工具。要工具。粗糙集的核心内容是属性重要性的度量和粗糙集的核心内容是属性重要性的度量和属性约简。属性约简。其中,约简是应用粗集理论的基其中,约简是应用粗集理论的基础,其内涵即为去掉多余的属性,或者说属础,其内涵即为去掉多余的属性,或者说属性约简的目的就是发现不重要的属性并去掉性约简的

    24、目的就是发现不重要的属性并去掉它们。因此,粗集非常适合于用来处理地震它们。因此,粗集非常适合于用来处理地震预测指标的独立性问题。预测指标的独立性问题。5.粗糙集粗糙集基于可辨识矩阵的属性约简方法基于可辨识矩阵的属性约简方法ODMA(Optimized Discernibility Matrix based Approach)使用约简算法分析地震预测参数的独立性使用约简算法分析地震预测参数的独立性 据中国震例库取测震学指标据中国震例库取测震学指标41项。项。1:地震条带;:地震条带;2:地震空区:地震空区(段段);3:地震活动分布地震活动分布(时间、空间、平静或增强时间、空间、平静或增强);4:

    25、前兆震:前兆震(群群);5:震群活:震群活动;动;6:地震活动性指标:地震活动性指标(综合指标综合指标A值,地震活动熵、地震活动度、模值,地震活动熵、地震活动度、模糊地震活动度糊地震活动度);7:地震强度因子:地震强度因子Mf值;值;8:震级容量维:震级容量维(D0值值);9:地:地震节律;震节律;10:应变释放:应变释放(能量释放能量释放);11:地震频度;:地震频度;12:b值;值;13:h值;值;14:地震窗;:地震窗;15:缺震;:缺震;16:诱发前震;:诱发前震;17:前震活动;:前震活动;18:震情指数:震情指数(A(b)值值);19:地震集中度:地震集中度(集中度集中度C、空间集

    26、中度、空间集中度C1、带状集中度、带状集中度Cb);20:地震时间间隔;:地震时间间隔;21:小震综合断层面解;:小震综合断层面解;22:P波初动符号矛盾比;波初动符号矛盾比;23:地震应力降;:地震应力降;24:环境应力值;:环境应力值;25:介质因子:介质因子(Q值值);26:波速:波速(波波速、波速比速、波速比);27:S波偏振;波偏振;28:地震尾波:地震尾波(持续时间比、衰减系数、持续时间比、衰减系数、衰减速率衰减速率p);29:振幅比;:振幅比;30:地脉动;:地脉动;31:地震波形;:地震波形;32:断层面总:断层面总面积面积(t)值值);33:小震调制比;:小震调制比;34:地

    27、震缺信量;:地震缺信量;35:地震非均匀度:地震非均匀度(GL值值);36:算法复杂性:算法复杂性(Ac);37:空区参数:空区参数(sH);38:有震面积数:有震面积数(A值);值);39:E、N、S三项指标;三项指标;40:h值;值;41:D值。值。5.1 地震预测指标独立性的粗集约简方法地震预测指标独立性的粗集约简方法 使用ODMA分析地震预报指标与地震的关系 决策表的构造决策表的构造 111项预测指标项预测指标 (41项测震学预报指标项测震学预报指标,70项前兆指标项前兆指标)地震预报情况地震预报情况 结果结果 41项测震学预报指标中项测震学预报指标中17项指标是绝对必要项指标是绝对必

    28、要彼此独立的彼此独立的 70项前兆指标中只有项前兆指标中只有12项指标是绝对必要彼项指标是绝对必要彼此独立的此独立的应用应用ODMA算法的属性约简结果算法的属性约简结果 得到下列五组属性约简集:得到下列五组属性约简集:1,2,3,4,6,10,11,12,13,14,15,17,26,28,29,31,33 1,2,3,4,6,10,11,12,13,14,15,17,21,26,28,29,33 1,2,3,4,6,10,11,12,13,14,15,17,20,26,28,29,33 1,2,3,4,6,10,11,12,13,14,15,17,18,26,28,29,33 1,2,3,4

    29、,6,10,11,12,13,14,15,16,17,26,28,29,33。5组中都不出现的属性组中都不出现的属性 5,7,8,9,19,22,23,24,25,27,30,32,34,35,36,37,38,39,40和和41为冗余属性。为冗余属性。在每组均出现的核属性在每组均出现的核属性 1,2,3,4,6,10,11,12,13,14,15,17,26,28,29和和33则为则为属性核属性核,为,为最有必要属性最有必要属性。5.2 基于粗集约简的支持向量机集成方法基于粗集约简的支持向量机集成方法使用使用RRESVM判断地震序列类型判断地震序列类型1:M2:Em/E3:P4:b值5:k值

    30、6:Mmax 7:T2.0使用使用RRESVM判断地震序列类型判断地震序列类型 在地震活动性分析中有许多预报指标,如在地震活动性分析中有许多预报指标,如 b值、值、值、值、C值、值、D值、值、Mf值等。这些指标都从不同侧值等。这些指标都从不同侧面反应了地震活动时间、空间和强度特征。目前面反应了地震活动时间、空间和强度特征。目前这类参数较多,同时它们之间还可能存在着一定这类参数较多,同时它们之间还可能存在着一定的相关性。另外在实际预报中,这些参量的变化的相关性。另外在实际预报中,这些参量的变化各有所异。这些都给实际预报带来困难。各有所异。这些都给实际预报带来困难。主成分分析是一种数据约减的有效方

    31、法,它可主成分分析是一种数据约减的有效方法,它可以把描述样本特征的多个有一定相关性的指标化以把描述样本特征的多个有一定相关性的指标化为少数几个综合指标的一种统计分析方法。为少数几个综合指标的一种统计分析方法。6.主成分分析法主成分分析法 选择与地震活动强度有关的一些参量:选择与地震活动强度有关的一些参量:3级以级以上地震频次上地震频次N(ML3.0)、b值、值、值、值、A(b)值、值、Mf 值、值、Ac 值这值这6个参量进行主成分分析。个参量进行主成分分析。图图1为为6.0级地震发生前后震中周围级地震发生前后震中周围200km范范围内的一些地震活动性参数随时间变化曲线,围内的一些地震活动性参数

    32、随时间变化曲线,可以看到,可以看到,6.0级地震前地震频次级地震前地震频次N、Mf值、值、A(b)值等出现相对较为明显的异常,另一些参数的值等出现相对较为明显的异常,另一些参数的异常变化则不明显。异常变化则不明显。6.1 1979年江苏溧阳年江苏溧阳6.0级地震震中附近级地震震中附近地区地震活动参数的主成分分析地区地震活动参数的主成分分析 在实际预报中,我们如何将上述反应地震在实际预报中,我们如何将上述反应地震强度异常特征的指标用一个综合指标来表示,强度异常特征的指标用一个综合指标来表示,本文根据主成分分析得到的主成分本文根据主成分分析得到的主成分Z i 和相应和相应的权值(贡献率)的权值(贡

    33、献率)e i 计算定义综合指标计算定义综合指标:这里将根据累计贡献率这里将根据累计贡献率Em85确定最小主确定最小主成分个数成分个数m(mp)。miiiZeW1表1 各参量在各主成分中的系数(特征向量)、特征值与贡献率 主成分主成分1 主成分主成分2 主成分主成分3 主成分主成分4 主成分主成分5 主成分主成分6 NbA(b)MfAc 0.49086 0.10742 0.61712 0.40315 -0.33684 -0.301125-0.39253 -0.34352 0.72342 -0.23443 0.01780 0.3863690.35066 -0.50609 -0.173190.520

    34、43 0.17390 0.538343-0.08537 0.66996 -0.014060.15064 -0.33004 0.641899-0.50707 0.22117 0.125430.63303 0.49057 -0.191870 0.46646 0.34138 0.22335 -0.29703 0.71160 0.146222特征值特征值 2.9751 1.6055 0.7073 0.4463 0.1958 0.0701 贡献率贡献率%49.585 26.758 11.788 7.4381 3.2631 1.1685 累计贡献率累计贡献率%49.585 76.342 88.130 95

    35、.568 98.832 100.00溧阳6.0级地震前后震中附近地区地震强度综合指标W随时间的变化6.2 一些中强以上地震前综合指标一些中强以上地震前综合指标W随时间的变化随时间的变化取取 N3、b、A(b)、Mf、Ac、C、D 8个参量个参量 因子分析法是主成分分析方法的推广和深化,因子分析法是主成分分析方法的推广和深化,也是一种数据约减的有效方法,也是一种数据约减的有效方法,它是把一些可能它是把一些可能有一定相关性的变量归结为少数几个综合因子的有一定相关性的变量归结为少数几个综合因子的一种多元统计分析方法。因子分析从一组观测数一种多元统计分析方法。因子分析从一组观测数据出发,通过研究其相关

    36、矩阵的内部结构,找出据出发,通过研究其相关矩阵的内部结构,找出对变量起支配作用的几个互不相关的因子。在尽对变量起支配作用的几个互不相关的因子。在尽量减少原始数据信息损失的前提下,量减少原始数据信息损失的前提下,用少数几个用少数几个公共因子去代替数量较多且有一定联系的原始变公共因子去代替数量较多且有一定联系的原始变量,量,从而达到揭示原始变量之间的内在联系、合从而达到揭示原始变量之间的内在联系、合理解释原始变量与主要因子关系的目的。理解释原始变量与主要因子关系的目的。7.因子分析法因子分析法 选择九江选择九江5.7级地震前与地震活动强度有关的级地震前与地震活动强度有关的6个参量,即地震频次个参量

    37、,即地震频次N(ML3.0)、b值、值、值、值、A(b)值、值、Mf值和值和Ac值进行因子分析。值进行因子分析。图图1为为6.0级地震发生前后震中周围级地震发生前后震中周围200km范围范围内的一些地震活动性参数随时间变化曲线,可以内的一些地震活动性参数随时间变化曲线,可以看到,看到,6.0级地震前地震频次级地震前地震频次N、Mf值、值、A(b)值等值等出现相对较为明显的异常,另一些参数的异常变出现相对较为明显的异常,另一些参数的异常变化则不明显。化则不明显。7.1 江西九江江西九江5.7级级地震前地震活动参数的因子分析地震前地震活动参数的因子分析 计算反映地震活动时、空、强特征计算反映地震活

    38、动时、空、强特征的综合指标的综合指标 根据各公共因子得分根据各公共因子得分 和相应的权和相应的权值(贡献率)值(贡献率)ei,本文定义反映地震,本文定义反映地震活动时、空、强特征的综合指标为活动时、空、强特征的综合指标为:miiifaFeW1iFfaW表1 各因子的特征值与贡献率特征值 贡献率%累计贡献率%因子1因子2因子3因子4因子5因子62.95530 49.2551 49.25511.28823 21.4707 70.72580.85578 14.2631 84.98880.58529 9.7549 94.74380.21244 3.5407 98.28450.10293 1.7155

    39、100.0000表2正交旋转后的因子载荷 因子1 因子2 因子3 因子4 NbA(b)MfAc 0.94671 0.02038 0.07004 -0.02899-0.23335 0.14261 -0.06846 0.95097-0.06585 -0.97681 -0.05794 0.14244 0.91365 -0.01462 0.09388 -0.28422 0.74387 0.38925 0.32979 -0.28997 0.15126 0.06317 0.98146 -0.06206 九江5.7级地震前后6参数因子分析综合指标Wfa随时间的变化 九江5.7级地震前后8参数因子分析综合指标

    40、Wfa随时间的变化 8、数据挖掘在地震领、数据挖掘在地震领域中的应用研究展望域中的应用研究展望 8.1 数据挖掘在地震预报中的可能应用数据挖掘在地震预报中的可能应用 前兆干扰因素的排除前兆干扰因素的排除(数据清洗、属性约简、关联规则数据清洗、属性约简、关联规则)地震异常的识别地震异常的识别(分类、聚类、离群数据挖掘、关联规则分类、聚类、离群数据挖掘、关联规则)异常地震活动异常识别异常地震活动异常识别(关联规则、序贯模式、分类、关联规则、序贯模式、分类、聚类、神经网络、聚类、神经网络、SVM)地震综合预报地震综合预报 (分类、聚类、神经网络、粗集分类、聚类、神经网络、粗集)地震序列类型判定和强余

    41、震预报的研究地震序列类型判定和强余震预报的研究 地震序列的相似性研究地震序列的相似性研究 如如 前震序列的相似性研究前震序列的相似性研究 地震序列类型判定的研究地震序列类型判定的研究(分类树、神经网络、分类树、神经网络、SVM)地震预报知识的学习和地震异常的发现地震预报知识的学习和地震异常的发现(分类、聚类、分类、聚类、关联规则、离群数据挖掘关联规则、离群数据挖掘)地震主要预报指标的提取和无用指标的排除地震主要预报指标的提取和无用指标的排除(属性约简属性约简)前兆干扰因素的排除(前兆干扰因素的排除(数据清洗数据清洗)数字化动水位的固体潮汐效应扣除固体潮汐的影响扣除固体潮汐的影响聊古一井气氡影响

    42、因素分析聊古一井气氡影响因素分析气象因素影响8.1 数据挖掘在地震预报中的可能应用数据挖掘在地震预报中的可能应用 前兆干扰因素的排除前兆干扰因素的排除(数据清洗、属性约简、关联规则数据清洗、属性约简、关联规则)地震前兆异常的识别地震前兆异常的识别(分类、聚类、离群分析、关联规则分类、聚类、离群分析、关联规则)异常地震活动的识别异常地震活动的识别(关联规则、序贯模式、分类、聚关联规则、序贯模式、分类、聚类、神经网络、类、神经网络、SVM)地震综合预报地震综合预报 (分类、聚类、神经网络、粗集分类、聚类、神经网络、粗集)地震序列类型判定和强余震预报的研究地震序列类型判定和强余震预报的研究 地震序列

    43、的相似性研究地震序列的相似性研究 如如 前震序列的相似性研究前震序列的相似性研究 地震序列类型判定的研究地震序列类型判定的研究(分类树、神经网络、分类树、神经网络、SVM)地震预报知识的获取地震预报知识的获取(关联规则、决策树、神经网络、关联规则、决策树、神经网络、SVM)地震主要预报指标的提取和无用指标的排除地震主要预报指标的提取和无用指标的排除(粗糙集粗糙集)8.2 数据挖掘在地震波数据的数据挖掘在地震波数据的实时处理中的可能应用实时处理中的可能应用 1、地震波的识别(在干扰中识别地震波信号)、地震波的识别(在干扰中识别地震波信号)2、地震震相的识别、地震震相的识别 3、天然地震与人工地震

    44、(爆破、核爆、矿爆等)、天然地震与人工地震(爆破、核爆、矿爆等)的识别的识别 4、风扰、海浪、汽车等干扰的识别、风扰、海浪、汽车等干扰的识别 上海地震台网地震记录图上海地震台网地震记录图 (2019(2019年年5 5月月2020日日1818时时1616分江苏昆山分江苏昆山0.70.7级地震级地震 )台阵定位结果台阵定位结果 (2019(2019年年5 5月月2020日日1818时时1616分江苏昆山分江苏昆山0.70.7级地震级地震)2019年年9月月15日汤加日汤加6.0级地震级地震O:23:04:37.0 Epc:22.39 S,175.04 W Ms:6.0 (资料来源资料来源IRIS

    45、)台阵台阵16个子台记录波形个子台记录波形PS聚束波形聚束波形10 m2019年年9月月15日汤加日汤加6.0级地震级地震震中距震中距83.2度度2019-12-15浙江桐乡浙江桐乡爆破爆破2019-11-20常熟常熟1.6级级地震地震地震与爆地震与爆破的识别破的识别8.3 数据挖掘在地震工程中的可能应用数据挖掘在地震工程中的可能应用 1、建构筑物抗震性能评估、建构筑物抗震性能评估 2、强地震的长期预测、强地震的长期预测 3、地震震害预测、地震震害预测 4、地震震害损失评估、地震震害损失评估 5、地震安全性评价、地震安全性评价 目前,在地震预测中使用的数据处目前,在地震预测中使用的数据处理方法仍然主要是一些常用统计方法。理方法仍然主要是一些常用统计方法。数据挖掘在地震预测以及地学领域的数据挖掘在地震预测以及地学领域的应用还是初步的。数据挖掘在地震预应用还是初步的。数据挖掘在地震预测以及地震领域有着广泛的应用前景。测以及地震领域有着广泛的应用前景。谢谢谢谢 !

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:数据挖掘在精选课件.ppt
    链接地址:https://www.163wenku.com/p-3325416.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库