回归分析法预测A课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《回归分析法预测A课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归 分析 预测 课件
- 资源描述:
-
1、 第八讲第八讲 回归分析法预测回归分析法预测(Regression Analysis)第1页,共33页。主要内容第一节 引 言第二节 一元线性回归第三节 多元线性回归第四节 逐步回归分析简介第2页,共33页。函数关系:变量间的确定性关系,有精确的数学表达式。统计关系:根据大量观测或试验数据建立起来的一种经验关系。变变量量间间的的关关系系 一、引 言第3页,共33页。矿床研究和矿产勘查结果表明,矿床的形成及矿床规模受各种地质条件的控制。矿床统计预测的主要目的就是建立矿床值(矿化强度)y与各种地质变量(控矿地质因素和找矿标志)(xi)之间函数关系,即 y=f(xi)(i=1,2,p)一旦这种函数关
2、系建立起来以后,便可以对未知单元进行成矿预测,这就是利用回归分析数学模型进行矿床统计预测的任务。第4页,共33页。(1)建立回归方程确定自变量(控矿因素和找矿标志)与因变量(矿床值)之间是否存在相关关系,找出它们之间合适的数学表达式;在矿床统计预测工作中,回归分析主要解决以下几个方面的问题:(2)确定各自变量的重要性及与因变量的相关程度在共同影响因变量的许多变量(自变量)之中,找出哪些是重要的,哪些是次要的,以及它们之间有什么关系。(3)成矿远景区预测根据一个或几个变量值(自变量,相对而言较易测定),来预测另一个地质变量(因变量)的估计值,并确定预测精度;第5页,共33页。概括地说,回归分析就
3、是要研究随机变量之间的数理统计关系,从大量不存在确定性关系的观测数据中,找出相关变量之间固有的规律性联系,建立自变量对因变量的回归方程;同时,它可以从多个自变量中选出最重要的、与因变量关系最密切的那些自变量。回归分析的数学模型是:01piiiybb x因变量y的回归估计值。xi自变量,即控矿地质因素或找矿标志。b0常数,bi待定系数,亦叫权系数(coefficient of weight)第6页,共33页。利用回归分析进行矿床统计预测的基本步骤利用回归分析进行矿床统计预测的基本步骤 .根据预测对象、预测范围和预测比例尺,将研究区划分成若干个单元,并选取控制单元。2变量的选取和研究(取值、变换、
4、构置、筛选)。地质数据预处理(标准化、均一化等)3.根据控制单元建立最优回归方程,并对其进行显著性检验。4.若回归方程通过检验,则可用于未知单元的预测,圈定成矿远景区,对远景区进行地质分析,检查和评价;若未通过检验,说明变量选取了不当或控制区选择不合理,重复上述步骤。第7页,共33页。二、线性回归分析(Linear Regression Analysis)1.一元线性回归分析(Univariant linear regression analysis)设某种控矿因素x与矿床值y之间有如下图所示的关系。xy第8页,共33页。显然,y和x之间的关系可用一条直线方程来拟合:该方程就称为y对x的线性回
5、归方程,其中:x自变量(控矿地质因素)xi所对应的y的回归估计值,称回归估值a常数,回归直线的截距(intercept)b待定系数,此时称回归系数(regression coefficient),数值上等于回归直线的斜率(slope)误差项 a+bx+第9页,共33页。显然,对同一批散点(样本),可以有无数条直线来拟合y与x的关系,但其中只有一条是最优的,这条直线所对应的函数关系就是我们要求的回归方程。那么,如何寻找这条最优的直线呢?数学上就是要寻找一对常数a和回归系数b,使偏差(deviation)-yi的平方和达到最小,即2211()()minnniiiiiiQyyabxyimum(最小二
6、乘法)第10页,共33页。根据极值的求法,欲使Q达到最小,只需分别求a,b的偏导数,并令其等于零,即:0Qa0Qb可以写成 112()02()0niiiniiiiQabxyaQabxyxa第11页,共33页。解上述方程组可得:22222()()nxyxybnxxxyxyanxx 于是得到最优一元线性回归方程:iiyabxx1 y1x2 y2x3 y3 .xn yn第12页,共33页。2.多元线性回归方程(multiple regression analysis)数学模型:建立最优回归方程的关键仍然是计算b0 和bi。方法如下:(1)利用原始观测数据矩阵求bi设研究区选取有n个控制单元,选取了p
7、个地质变量,因此需要对(p+1)个变量(xi,y)进行n次观测,获得n组观测数据和由n个方程组成的方程组。12.nyyyy1112121222121.1.1.ppnnnpxxxxxxxxxXb0b1bpB=01piiiybb x+第13页,共33页。0.00p10bQbQbQn x1 x2xp x1 21x x1x2 x1xp x2 x2x1 22x x2xp xp x px1 xpx2 2pxb0 b1 b2 bp=y x1y x2y xpy x11,x21,xn1表示第1个变量在第1,2,n个单元中的取值第14页,共33页。以A,B,C分别代表上述三个矩阵,则A B=C 1 1 1 1 x
8、11 x12 x1p x11 x21 xn1 1 x21 x22 x2p x12 x22 xn2 1 x31 x32 x3p =x1p x2p xnp 1 xn1 xn2 xnp XXn x1 x2xp x1 21x x1x2 x1xp x2 x2x1 22x x2xp xp x px1 xpx2 2px矩阵A=为一对称矩阵,可通过原始数据的增广矩阵X表示如下第15页,共33页。矩形C可写成:1 1 1 y1 x11 x21 xn1 y2 C=x12 x22 xn2 y3 =x1p x2p xnp ynX Y于是,11()BA CX XX Y B就是我们所需要的回归系数矩阵(有p个元素b0,b
9、1,b2,bp组成)A-1是A 的逆矩阵(inverse matrix)第16页,共33页。(2)利用相关矩阵求 将原始数据标准化以后,计算相关矩阵如下:1 r12 r13 r1p r1y r21 1 r23 r2p r2y rij=r31 r32 1 r3p riy=r3y rp1 rp2 rp3 1 rpy第17页,共33页。数学上可以证明:1 r12 r13 r1p b1 r1y r21 1 r23 r2p b2 r2y r31 r32 1 r3p b3 =r3y rp1 rp2 rp3 1 bp rpy简写为:B=rij-1riy B就是回归系数矩阵。求出bi后,利用以下公式计算b0,
展开阅读全文