地质数据处理全册配套课件合辑(共312页).ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《地质数据处理全册配套课件合辑(共312页).ppt》由用户(金钥匙文档)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 地质 数据处理 配套 课件 312
- 资源描述:
-
1、地学数据处理基础 洪金益 中南大学地学院 课程的主要内容 第一部分 统计学基础 认识数据的基本特征和简单规律 第二部分 地学统计学 研究数据的空间相关性和空间依赖性 第三部分 空间数据挖掘 从空间数据中获取隐含的、未知的、有用的知 识 主要参考教材 行为科学统计概要 主要参考教材 统计学科学与工程应用 主要参考教材 地质统计学 主要参考教材 课时安排 地学数据处理的教学课时安排: 课堂教学 36学时 实验教学 10学时 课程考试 2学时 - 合 计 48学时 学习成绩评定: 上课及课堂提问 20% 实验及作业 20% 期末考试 60% - 合 计 100% 前置知识 1.线性代数的基础; 2.
2、概率论与数理统计的基础; 3. MATLAB或有关数据处理软件的基础; 第一部分 统计学及其基本方法 统计数据的内在规律 1. 正常条件下新生婴儿的性别比为107:100 2. 投掷一枚均匀的硬币,出现正面和反面的频 率各为1/2;投掷一枚骰子出现16点的频率 各为1/6 3. 铅锌矿石中铅的品位与银的品位之间的关系 统计学概述 统计学主要又分为描述统计学和推断统 计学。给定一组数据,统计学可以摘要并且 描述这份数据,这个用法称作为描述统计学。 另外,观察者以数据的形态建立出一个用以 解释其随机性和不确定性的数学模型,以之 来推论研究中的步骤及母体,这种用法被称 做推论统计学。这两种用法都可以
3、被称作为 应用统计学。另外也有一个叫做数理统计学 的学科专门用来讨论这门科目背后的理论基 础。 统计学的发展历程 统计学的英文statistics最早是源于现代拉丁文 statisticum collegium (国会)以及意大利文 statista (国民或政治家)。 德文Statistik,最早是由Gottfried Achenwall(1749)所使用,代表对国家的资料进行分析的学 问,也就是“研究国家的科学”。 统计学是一门很古老的科学,一般认为其学理研究始于 古希腊的亚里斯多德时代,迄今已有2300多年的历史。它起 源于研究社会经济问题,在两千多年的发展过程中,统计学 至少经历了“城
4、邦政情”,“政治算数”和“统计分析科学” 三个发展阶段。所谓“数理统计”并非独立于统计学的新学 科,确切地说它是统计学在第三个发展阶段所形成的所有收 集和分析数据的新方法的一个综合性名词。概率论是数理统 计方法的理论基础,但是它不属于统计学的范畴,而属于数 学的范畴。 统计学的发展过程的三个阶段 第一阶段称之为“城邦政情”第一阶段称之为“城邦政情”(Matters of state)阶段阶段 “城邦政情”阶段始于古希腊的亚里斯多德撰写 的“城邦纪要”。他一共撰 写了一百五十馀种纪要,其内容包括各城邦的历史,行政,科学,艺术,人口, 资源和财富等社会和经济情况的比较,分析,具有社会科学特点。这个
5、阶段延续 了一两千年,直至十七世纪中叶才逐渐被“政治算数”这个名词所替代,并且很 快被演化为“统计学”(Statistics)。统计学依然保留了城邦(state)这个词根。 第二阶段称之为“政治算数”第二阶段称之为“政治算数”(Politcal arthmetic)阶段阶段 “政治算数”的特点是统计方法与数学计算和推理方法开始结合,分析社会经 济问题的方式更加注重运用定量分析方法。主要应用于国家的数据统计。 第三阶段称之为“统计分析科学”第三阶段称之为“统计分析科学”(Science of statistical analysis)阶段阶段 在“政治算数”阶段出现的统计与数学的结合趋势逐渐发展
6、形成了“统计分 析科学”。十九世纪末,欧洲大学开设的“国情纪要”或“政治算数”等课程名 称逐渐消失,代之而起的是“统计分析科学”课程。课程的内容仍然是分析研究 社会经济问题。1908年,“学生”氏(William Sleey Gosset的笔名Student)发表 了关于t分布的论文,这是一篇在统计学发展史上划时代的文章。它创立了小样本 代替大样本的方法,开创了统计学的新纪元。现代统计学的理论基础概率论始于 研究赌博的机遇问题,逐渐形成了概率论理论框架。在概率论的基础上,到十九 世纪初,逐渐建立了观察误差理论,正态分布理论和最小平方法则。于是,现代 统计方法便有了比较坚实的理论基础。 迅速发展
7、的统计学迅速发展的统计学 20世纪初以来,科学技术迅猛发展,社会发生了巨大变化,统计学进入了快 速发展时期。归纳起来有以下几个方面。 1、由记述统计向推断统计发展。记述统计是对所搜集的大量数据资料进行 加工整理、综合概括,通过图示、列表和数字,如编制次数分布表、绘制直方图、 计算各种特征数等,对资料进行分析和描述。而推断统计,则是在搜集、整理观 测的样本数据基础上,对有关总体作出推断。其特点是根据带随机性的观测样本 数据以及问题的条件和假定(模型),而对未知事物作出的,以概率形式表述的 推断。 2、由社会、经济统计向多分支学科发展。在20世纪以前,统计学的领域主 要是人口统计、生命统计、社会统
8、计和经济统计。随着社会、经济和科学技术的 发展,到今天,统计的范畴已覆盖了社会生活的一切领域,几乎无所不包,成为 通用的方法论科学。它被广泛用于研究社会和自然界的各个方面,并发展成为有 着许多分支学科的科学。 3、统计预测和决策科学的发展。传统的统计是对已经发生和正在发生的事 物进行统计,提供统计资料和数据。20世纪30年代以来,特别是第二次世界大战 以来,由于经济、社会、军事等方面的客观需要,统计预测和统计决策科学有了 很大发展,使统计走出了传统的领域而被赋予新的意义和使命。 4、信息论、控制论、系统论与统计学的相互渗透和结合,使统计科学进一 步得到发展和日趋完善。信息论、控制论、系统论在许
9、多基本概念、基本思想、 基本方法等方面有着共同之处,三者从不同角度、侧面提出了解决共同问题的方 法和原则。三论的创立和发展,彻底改变了世界的科学图景和科学家的思维方式, 也使统计科学和统计工作从中吸取了营养,拓宽了视野,丰富了内容,出现了新 的发展趋势。 5、计算技术和一系列新技术、新方法在统计领域不断得到开发和应用。近 几十年间,计算机技术不断发展,使统计数据的搜集、处理、分析、存贮、传递、 印制等过程日益现代化,提高了统计工作的效能。计算机技术的发展,日益扩大 了传统的和先进的统计技术的应用领域,促使统计科学和统计工作发生了革命性 的变化。如今,计算机科学已经成为统计科学不可分割组成部分。
10、随着科学技术 的发展,统计理论和实践深度和广度方面也不断发展。 6统计在现代化管理和社会生活中的地位日益重要。随着社会、经济和科 学技术的发展,统计在现代化国家管理和企业管理中的地位,在社会生活中的地 位,越来越重要了。人们的日常生活和一切社会生活都离不开统计。英国统计学 家哈斯利特说:“统计方法的应用是这样普遍,在我们的生活和习惯中,统计的 影响是这样巨大,以致统计的重要性无论怎样强调也不过分。”甚至有的科学有 还把我们的时代叫做“统计时代”。显然,统计科学的发展及其未来,已经被赋 予了划时代的意义。 统计学现状 在科学技术飞速发展的今天,统计学广泛吸收和融合相关学科的新理论,不 断开发应用
11、新技术和新方法,深化和丰富了统计学传统领域的理论与方法,并拓 展了新的领域。 第一,对系统性及系统复杂性的认识为统计学的未来发展增加了新的思路。 由于社会实践广度和深度迅速发展,以及科学技术的高度发展,人们对客观世界 的系统性及系统的复杂性认识也更加全面和深入。复杂现象,如模糊现象、突变 现象及混沌现象等新的领域,给统计开辟了新的研究领域。 第二,定性与定量相结合的综合集成法将为统计分析方法的发展提供新的思 想。定性与定量相结合的综合集成方法是钱学森教授于1990年提出的。这一方 法的实质就是将科学理论、经验知识和专家判断相结合,提出经验性的假设,再 用经验数据和资料以及模型对它的确实性进行检
12、测,经过定量计算及反复对比, 最后形成结论。 第三,统计科学与其他科学渗透将为统计学的应用开辟新的领域。模糊论、 突变论及其他新的边缘学科的出现为统计学的进一步发展提供了新的科学方法和 思想。 统计学产生于应用,在应用过程中发展壮大。随着经济社会的发展、各学科 相互融合趋势的发展和计算机技术的迅速发展,统计学的应用领域、统计理论与 分析方法也将不断发展,在所有领域展现它的生命力和重要作用。 统计学统计学 统计学指的是一套组织、总结和解释信息的数学过程。 统计过程帮助研究者确定信息或观测值是以一种准确的、信息丰富的方式呈 现和解释的。从宏观上来看,统计帮助研究者从混乱中找出规律。另外,统计为 整
13、个科学团体提供了一套标准的技术来相互辨认和理解。因此,一个研究者和其 他研究者所用的统计方法是相似的,这样一来,研究者们就可以通过完整地理解 分析过程了解研究结果的意义,进而对数据分析作出准确的解释。 第一章 统计学概论 1.1 统计、科学和观察 1.2 常用术语 什么是统计? 1. 统计工作统计工作 收集数据的活动收集数据的活动 2. 统计数据统计数据 对现象计量的结果对现象计量的结果 3. 统计学统计学 分析数据的方法与技术分析数据的方法与技术 什么是统计学? 1. 数据搜集:例如,调查与 试验 2. 数据整理:例如,分组 3. 数据展示:例如, 图和表 4. 数据分析:例如,回归分析 统
14、计学是一门收集、整理和分析数据的方法科学 ,其目的是探索数据的内在数量规律性,以达到 对客观事物的科学认识 1 统计、科学和观察 统计学: 统计学是一套组织、总结和解释信息的数 学过程。 统计学的分科 描述统计描述统计 推断统计推断统计 统计学的分科统计学的分科 理论统计理论统计 应用统计应用统计 统计的作用 1统计是用来组织和总结信息的,所以, 研究者可以看到在研究中发生了什么,同 时可以与其他人交流研究结果。 2统计通过确定得到的结果中哪些结论 是合理的,来帮助研究者回答想要研究的 主要问题。 2 常用术语 总体总体是特定研究中所关注的所有个体的集合。 特征: 总体在时间、空间上的大小由研
15、究者定义 而决定,因此大小会有明显的差异,从极 大的到很小的都有。如一个勘查区中的全 部土壤地化数据。 构成总体的数据属性也有很大差异。如某 勘查区的化探、物探、遥感等数据。 样本(样品)是指那些从总体中选出的个体,通 常在研究中是被用来代表总体的。 特征: 是总体的一部分,而代表着总体; 对样本的研究结果要推广到总体。 参数和统计量 描述数据时有必要区分数据是来自总体还 来自是样本。一个用来描述总体的特征 如,总体平均数被称做参数。另一 方面,描述一个样本的特征被称做统计量。 如:一批土壤地化分析数据中,Pb的平均 值则为参数,而每个样品分析Cu、Pb、Zn 三个元素称为统计量。 定义: 参
16、数参数通常是一个描述总体的数值。参数可 能是从某种单一的测量得到的,也可能来 源于一系列对总体的测量。 统计量统计量通常是一个描述样本的数值。统计 量可能是从某种单一的测量中得到的,也 可能来源于一系列对样本的测量。 描述和推论统计方法 研究的问题是通过收集信息开始的。在 科学中,信息是通过对个体进行观察和记 录测量而得到的。对个体进行测量或是观 察得到的结果被称做数据,更普遍的情况 下,也被称做一个分数或原始分数。一整 套分数或测量结果被称做数据集或简单地 称做数据。当得到数据以后,就用统计方 法来整理和描述这些数据。 定义: 数据是测量或观察所得的结果。一个数据 集是一系列的测量或观察结果
17、。一个数据 是一个单独测量或观察的结果,同时它常 常被叫做分数或原始分数。 研究者开发出许多不同种类的统计程序 来整理和描述这些数据,这些不同的统计 过程可以被分为两大类。第一类是描述统 计,第二类是推论统计。 描述统计是那些用来总结、整理和简化数据 的统计方法。 描述统计是整理或总结原始分数,使这些数 据更便于管理的技术。通常分数会被整理到一个 表格或图形中,这样一来我们就可以看到整个分 数的情况。另一个常用的技术是通过计算平均数 来总结所有的数据。即使数据集中有几百个分数, 平均数也可以给全体数据提供一个单一的描述值。 推论统计包括能够用于研究样本并对样本 所来自的总体作出推论的技术。 总
18、体通常都很大,所以我们选出样本来 代表总体。我们希望通过样本的分析,得 到关于总体的信息。 但是,使用样本的一个问题是,样本只 能提供关于总体的有限信息。尽管总的来 说样本能代表总体,但样本并不能完美、 准确地描绘出总体的情况。通常,一个样 本的统计量和相应的总体参数之间是有差 异的。这个差异被称做抽样误差。 抽样误差是一种或一些存在于样本统计 量和相应的总体参数间的误差(随机误差)。 变量:变量:是个体可以改变或者有不同取值的一种特征或情况。变量是相对 于常数而言的。 常数常数是一个不变的、对每个个体都相同的特征或环境。 自变量自变量:变量的属性值不因其他变量属性值的变化而变化的变量; 因变
19、量因变量:变量的属性值因其他变量属性值的变化而变化的变量; 相关相关:变量之间的相互关联性; 离散变量离散变量:由可计数的、分离的、不能分割的数值组成的变量,如样本 个数; 连续变量连续变量:有无限多个的可能值在任意两个观察值之间,如时间; 统计学的应用领域 统计学统计学 经济学经济学 管理学管理学 医学医学 工程学工程学 社会学社会学 统计方法 统计方法统计方法 描述统计描述统计 推断统计推断统计 参数估计参数估计 假设检验假设检验 描述统计 1. 内容内容 搜集数据 整理数据 展示数据 2. 目的目的 描述数据特征 找出数据的基本规律 0 25 50 Q1 Q2 Q3 Q4 ¥ x = 3
20、0 s2 = 105 推断统计 1. 内容内容 参数估计 假设检验 2. 目的目的 对总体特征作出 推断 样 本 总体 描述统计与推断统计的关系 反映客观反映客观 现象的数现象的数 据据 总体内在的总体内在的 数量规律性数量规律性 推断统计推断统计 (利用样本信息和概率(利用样本信息和概率 论对总体的数量特征进论对总体的数量特征进 行估计和检验等)行估计和检验等) 概率论概率论 (包括分布理论、大数定律(包括分布理论、大数定律 和中心极限定理等)和中心极限定理等) 描述统计描述统计 (统计数据的搜集、整(统计数据的搜集、整 理、显示和分析等)理、显示和分析等) 总体数据 样本数据 统计学探索现
21、象数量规律性的过程统计学探索现象数量规律性的过程 理论统计与应用统计 1. 理论统计理论统计 研究统计学的一般理论 研究统计方法的数学原理 2. 应用统计应用统计 研究统计学在各领域的具体应用 统计学与数学的关系 (联系) 1. 统计学运用到大量的数学知识 2. 数学为统计理论和统计方法的发展提供基 础 3. 不能将统计学等同于数学 统计学与数学的关系 (区别) 1. 数学研究的是抽象的数量规律,统计学则是 研究具体的、实际现象的数量规律 2. 数学研究的是没有量纲或单位的抽象的数, 统计学研究的是有具体实物或计量单位的数 据 3. 统计学与数学研究中所使用的逻辑方法不同 数学研究所使用的主要
22、是的演绎 统计学则是演绎与归纳相结合,占主导地位的 是归纳 统计学与其他学科的关系 1. 统计学可以用到几乎所有的学科领域 2. 统计学可以帮助其他学科探索学科内在 的数量规律性 3. 统计学不能解决各学科领域的所有问题 4. 对统计分析结果的解释需要各学科领域 的专业人员 地质数据处理基础2 洪金益 中南大学地学院 第二章 统计数据的采集与预处理 1、地质数据的采集 2、数据的预处理 3、数据的计量尺度 1 数据的采集 以某化探数据的采集为例,步骤:以某化探数据的采集为例,步骤: 1.采样设计采样设计(按国家、行业规范按国家、行业规范); 2.采样采样(保证质和量、记录规范、必要的备注保证质
23、和量、记录规范、必要的备注); 3.加工加工(防止污染和编号错乱防止污染和编号错乱); 4.送样化验分析送样化验分析(根据研究目的和研究对象的内在关联性来确根据研究目的和研究对象的内在关联性来确 定分析项目、选择分析方法、仪器类型定分析项目、选择分析方法、仪器类型)。 遥感数据是常用的地质数据之一,订购数据要选择航天遥感数据是常用的地质数据之一,订购数据要选择航天 器的类型、波段的特点,产品的级别等等。器的类型、波段的特点,产品的级别等等。 2 数据预处理 数据预处理的必要性 没有干净的数据不可能获得好的处理结果; 任何数据都是有污染的、有冗余的; 数据一般有多种格式的,要进行统一格式或格式规
展开阅读全文