数据处理专题一元数据处理方法课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《数据处理专题一元数据处理方法课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据处理 专题 一元 方法 课件
- 资源描述:
-
1、一.一元数据处理方法二.多元数据处理方法三.如何写好建模竞赛论文数据处理专题数据处理专题1谢谢观赏2019-8-23数据处理是指用简明而严格的方法把获得的实验数据所代表的事物内在的规律提炼出来,得出结果的加工过程,包括数据记录、描绘曲线,从带有误差的数据中提取参数,验证和寻找经验规律,外推实验数据等等。本章介绍一些最基本的数据处理方法。2谢谢观赏2019-8-231.插值插值 2.拟合及线性回归拟合及线性回归1.一元数据处理方法 在解决实际问题的生产(或工程)实践和科学实验过程中,通常需要通过研究某些变量之间的函数关系来帮助我们认识事物的内在规律和本质属性,而这些变量之间的未知函数关系又常常隐
2、含在从试验、观测得到的一组数据之中。因此,能否根据一组试验观测数据找到变量之间相对准确的函数关系就成为解决实际问题的关键3谢谢观赏2019-8-23 例如在工程实践和科学实验中,常常需要从一组试验观测数据(xi,yi),i=0,1,.,n之中找到自变量x与因变量y 之间的函数关系,一般可用一个近似函数y=f(x)来表示。函数y=f(x)的产生办法因观测数据和要求不同而异,通常可采用数据拟合与函数插值两种办法来实现。数据拟合数据拟合主要是考虑到观测数据受随机观测误差的影响,进而寻求整体误差最小、能较好反映观测数据的近似函数y=f(x),此时并不要求所得到的近似函数y=f(x)满足yi=f(xi)
3、,i=0,1,n。函数插值函数插值则要求近似函数y=f(x)在每一个观测点 xi 处一定要满足y i=f(xi),i=0,1,n,在这种情况下,通常要求观测数据相对比较准确,即不考虑观测误差的影响。4谢谢观赏2019-8-23在实际问题中,通过观测数据能否正确揭示某些变量之间的关系,进而正确认识事物的内在规律与本质属性,往往取决于两方面因素。其一其一是观测数据的准确性或准确程度,这是因为在获取观测数据的过程中一般存在随机测量误差,导致所讨论的变量成为随机变量。其二其二是对观测数据处理方法的选择,即到底是采用插值方法还是用拟合方法,插值方法之中、拟合方法之中又选用哪一种插值或拟合技巧来处理观测数
4、据。插值问题忽略了观测误差的影响,而拟合问题则考虑了观测误差的影响。但由于观测数据客观上总是存在观测误差,而拟合函数大多数情况下是通过经验公式获得的,因此要正确揭示事物的内在规律,往往需要对大量的观测数据进行分析,尤为重要的是进行统计分析。统计分析的方法有许多,如方差分析、回归分析等。5谢谢观赏2019-8-23 数据拟合虽然较有效地克服了随机观测误差的影响,但从数理统计的角度看,根据一个样本计算出来的拟合函数(系数),只是拟合问题的一个点估计,还不能完全说明其整体性质。因此,还应该对拟合函数作区间估计或假设检验,如果置信区间太大或包含零点,则由计算得到的拟合函数系数的估计值就毫无意义。这里所
5、采用的统计分析方法就是所谓的回归分析。另外还可用方差分析的方法对模型的误差作定量分析。对于插值方法,本文简单介绍最常用的插值法的基本结论及其Matlab实现问题。由于数据拟合问题必须作区间估计或假设检验,所以除了介绍最基本的数据拟合方法最小二乘法的基本结论及其Matlab实现问题外,我们专门介绍了对数值拟合问题进行区间估计或假设检验的统计方法。6谢谢观赏2019-8-23即介绍回归分析方法及其Matlab实现。数据处理问题通常情况下只是某个复杂实际问题的一个方面或部分内容,因而这里所介绍的数据处理方法函数插值和数据拟合的方法(包括回归分析)通常只能解决实际问题中的部分问题计算问题。一般来说,对
6、实际问题进行数学建模需要用到多方面知识,只有很少的情况下可以单独使用本章所介绍的内容,故我们最后以修改后的美国91年数学建模A题为例说明如何使用数值计算知识建立数学模型,从而解决实际问题的方法。7谢谢观赏2019-8-23 1 1、插、插 值值 法法 在生产和实验中,常常需要根据一张表格表示的函在生产和实验中,常常需要根据一张表格表示的函数推算该表中没有的函数值数推算该表中没有的函数值.解决此类问题的简单途径之解决此类问题的简单途径之一利用插值法。一利用插值法。插值在数学发展史上是一个老问题,它是和插值在数学发展史上是一个老问题,它是和Gauss,Lagrange,Newton等在著名数学家连
7、在一起的。它最初等在著名数学家连在一起的。它最初来源于天体计算来源于天体计算由若干观测值计算人一时刻星球的由若干观测值计算人一时刻星球的位置。现在,插值法在工程技术和数据处理有许多直接位置。现在,插值法在工程技术和数据处理有许多直接应用,而且也是数值积分、数值微分的基础。应用,而且也是数值积分、数值微分的基础。8谢谢观赏2019-8-231.1 插值概念与基础理论插值概念与基础理论1.1.1 插值问题的提法对于给定的函数表xx0 x1.xnY=f(x)y0y1.yn(其中其中 在在a,b上连续,上连续,x0,x1,xn 是是 a,b上的上的 n+1个互异的点个互异的点),在某函数类,在某函数类
8、(x)中求一个函数中求一个函数(x),使,使()yf x (xi)=yi,(i=0,1,2,n)(2)(1)并用并用函数函数(x)作为函数作为函数 y=f(x)的近似的近似函数,即函数,即y=f(x)(x),(xa,b)9谢谢观赏2019-8-23 这类问题称为这类问题称为插值问题插值问题。a,b称为称为插值区间插值区间,x0,x1,.,xn 称为称为插值节点插值节点,(,(2)称为)称为插值条件插值条件,插值条件,插值条件是选择近似函数的标准,满足此条件的近似函数是选择近似函数的标准,满足此条件的近似函数 (x)称称为为插值函数插值函数,f(x)称为称为被插值函数被插值函数。函数类函数类(x
9、)有多种取法,常用的有代数多项式、有多种取法,常用的有代数多项式、三角函数和有理函数。三角函数和有理函数。最简单的插值函数是代数多项式最简单的插值函数是代数多项式,相应的插值问题称为多项式多项式插值插值。最简单的插值函数是代数多项式最简单的插值函数是代数多项式,相应的插值问题称为多项式多项式插值插值。10谢谢观赏2019-8-23 求)(xf的n次插值多项式()nypx 的几何意义,就是)(xfy 上的若干个节点,作一条代数曲线()nypx 来近似代替曲线)(xfy。如图所示。通过曲线11谢谢观赏2019-8-231.2 插值多项式的求法插值多项式的求法 在前面讨论插值多项式的存在唯一性时,实
10、际上已提供在前面讨论插值多项式的存在唯一性时,实际上已提供了它的一种求法,即通过求解线性方程组来确定其系数了它的一种求法,即通过求解线性方程组来确定其系数ai(i=0,1,2,n)但是这种方法不仅计算量大,而且因不能获得简明的表但是这种方法不仅计算量大,而且因不能获得简明的表达式而给理论和应用研究带来不便。在这里我们学习两种达式而给理论和应用研究带来不便。在这里我们学习两种简便而实用的求答。简便而实用的求答。1.2.1 拉格朗日插值多项式拉格朗日插值多项式 在线性代数中知道,所有次数不超过在线性代数中知道,所有次数不超过n次的多项式构次的多项式构成一个成一个n+1维线性空间。其基有各种不同的取
11、法。因此维线性空间。其基有各种不同的取法。因此尽管满足条件(尽管满足条件(4)的)的n次插值多项式是唯一的,然而它次插值多项式是唯一的,然而它的表达式可以有多种不同的形式。如果取满足条件:的表达式可以有多种不同的形式。如果取满足条件:12谢谢观赏2019-8-230,()1,kiikikl x 的一组n次多项式xlxlxlxln,210作为上述线性空间的基,则容易看出10010()()()()nnnk kklx ylx ylx yy lx n 是是一一个个次次数数不不超超过过 的的多多项项式式。且且满满足足插插值值条条件件(4 4)。因此,由n+1个代数多项式 xlxlxlxln,210线性生
12、成的多项式(10)就是满足插值条件的n次插值多项式。(10)(9)满足条件(9)的多项式称为n+1个节点的n次基本插值多项式(或n次基函数)xlxlxlxln,21013谢谢观赏2019-8-23 显然,求拉格朗日多项式的关键是求n次插值基函数。0,()1,kiikikl x 因此,可设 0111()().()().()kkkknlxAxxxxxxxxxx 因为 xlk为n次多项式,且n 011011()()()()()()()()()nkkkkkkknkkxxxxxxxxlxxxxxxxxx 14谢谢观赏2019-8-23两种特殊的两种特殊的Lagrange插值多项式插值多项式1.线性插值线
13、性插值(两点插值两点插值)最简单的插值是线性插值最简单的插值是线性插值(此时此时n=1),这时插值问题这时插值问题就是就是求一次多项式求一次多项式P1(x)=a0+a1x 使它满足使它满足条件条件P1(x0)=y0,P1(x1)=y1,这时这时1001()xxlxxx 0110()xxlxxx 于是线性插值多项式为于是线性插值多项式为011010110()xxxxL xyyxxxx 即即100010()()nyyLxyxxxx 它就是通过它就是通过M0(x0,y0)和和M1(x1,y1)两点的线段两点的线段.15谢谢观赏2019-8-232.抛物插值抛物插值 线性插值仅仅用两个节点以上的信息,
14、精确度较差。为线性插值仅仅用两个节点以上的信息,精确度较差。为了提高精确度,我们进一步考察以下三点的插值问题了提高精确度,我们进一步考察以下三点的插值问题(n=2):这时1200102()()()()()xxxxlxxxxx 0211012()()()()()xxxxlxxxxx 0122021()()()()()xxxxlxxxxx 由此得到抛物插值多项式由此得到抛物插值多项式20 01 12 2()()()()L xy l xy l xy l x 抛物插值又称三点插值抛物插值又称三点插值.16谢谢观赏2019-8-23xyln 例例1 1 已知已知的函数表的函数表x 10 11 12 13
15、 14y 2.3026 2.3979 2.4849 2.5649 2.6391 ln(11.5)并估计误差。并估计误差。分别用拉格朗日线性和抛物线插值求分别用拉格朗日线性和抛物线插值求的近似值,的近似值,%lagrange插值法的程序插值法的程序function y=lagrange(x0,y0,x);n=length(x0);m=length(x);for i=1:mz=x(i);s=0.0;for k=1:np=1.0;for j=1:nif j=kp=p*(z-x0(j)/(x0(k)-x0(j);endends=p*y0(k)+s;endy(i)=s;endclearx0=10 11
16、12 13 14;y0=2.3026 2.3979,2.4849,2.5649 2.6391;x=10:0.1:15;y=lagrange(x0,y0,x);plot(x0,y0,+,x,y)17谢谢观赏2019-8-23 1901年龙格年龙格(Runge)给出一个例子给出一个例子:定义在区间-1,1上,这是一个光滑函数,它的任意阶导数都存在,对它在-1,1上作等距节点插值时,插值多项式情况,见图:从图中,可见,在靠近-1或1时,余项会随n值增大而增大,如P12(0.96)=36!但f(0.96)=0.25 21()1fxx-5-4-3-2-1012345-1.5-1-0.500.511.52
17、n=2n=4n=6n=8n=10f(x)=1/(1+x2)18谢谢观赏2019-8-23 从图中,还可发现,在0附近插值效果是好的,即余项较小,另一种现象是插值多项式随节点增多而振动更多。这种插值多项式当节点增加时反而不能更好地接近被插之数的现象,称为龙格现象龙格现象。上述现象和定理,告诉我们用高次插值多项式是不妥当的,从数值计算上可解释为高次插值多项式的计算会带来舍入误差的增大,从而引起计算失真。那么如何提高插值精度呢?采用分段插值是一种办法。实践上作插值时一般只用一次、二次最多用三次插值多项式。19谢谢观赏2019-8-23分段线性插值的构造分段线性插值的构造:设f(x)是定义在a,b上的
18、函数,在a,b上节点 a=x0 x1x2xn-1xn=b,的函数值为 y0,y1,y2,yn-1,yn 。(x)在每个子区间xi,xi+1(i=0,1,2,n-1)上是一次插 值多项式;11111 iiiiiiiiiixxxxxxxyxxxxyx,)(这种分段低次插值称为分段线性插值分段线性插值.在几何上就是用折线段带代替曲线,故分段线性插值又称为折线插值折线插值.(,),0,1,kkxyin实际上是连接点的一条折线1.2.2 分段线性插值分段线性插值分段线性插值:分段线性插值:matalb调用格式:调用格式:yi=interp1(x,y,xi,linear)x,y为插值节点,xi为待求节点2
19、0谢谢观赏2019-8-23分段线性插值曲线图:-4-3-2-101234-1-0.8-0.6-0.4-0.200.20.40.60.81曲线的光滑性较差在节点处有尖点 但如果增加节点的数量减小步长,会改善插值效果21谢谢观赏2019-8-23xyln 例例1 1 已知已知的函数表的函数表x 10 11 12 13 14y 2.3026 2.3979 2.4849 2.5649 2.6391 ln(11.5)并估计误差。并估计误差。分别用拉格朗日线性和抛物线插值求分别用拉格朗日线性和抛物线插值求的近似值,的近似值,clearx0=10 11 12 13 14;y0=2.3026 2.3979,
20、2.4849 2.5649 2.6391;x=10:0.1:15;y1=interp1(x0,y0,x,linear);yy1=interp1(x0,y0,11.5,linear);y2=interp1(x0,y0,x,cubic);yy2=interp1(x0,y0,11.5,cubic);subplot(1,2,1)plot(x0,y0,+,x,y1,11.5,yy1,rO)title(Piecewise linear)subplot(1,2,2)plot(x0,y0,+,x,y2,11.5,yy2,rO)title(Piecewise cubic)22谢谢观赏2019-8-23分段二次插
21、值分段二次插值即:选取跟节点x最近的三个节点xi-1,xi,xi+1进行二次插值,即在区间xi-1,xi+1,取:这种分段的低次插值叫分段二次插值,在几何上就是用分段抛物线代替y=f(x),故分段二次插值又和分段抛物插值。11112iikikjijikjikxxxxyxLxf)()()()(matlab调用格式调用格式yi=interp1(x,y,xi,cubic)%二次多项式插值二次多项式插值23谢谢观赏2019-8-23什么是样条:是 指飞机或轮船等的制造过程中为描绘出光滑的外形曲线(放样)所用的工具样条本质上是一段一段的三次多项式拼合而成的曲线在拼接处,不仅函数是连续的,且一阶和二阶导数
22、也是连续的1946年,Schoenberg将样条引入数学,即所谓的样条函数 1.3 三次样条三次样条插值插值24谢谢观赏2019-8-23,)(,)(),(),()1(2baCxSbaxSxSxS 即上连续都在区间上都是三次多项式在每个小区间,)()2(1kkxxxS处的函数值为在节点如果函数nxxxxf,)()3(10njyxfjj,1,0,)()S x而满足njyxSjj,1,0,)(上的三次样条插值函数在为则称,)()(baxfxS-(1)定义1.的一个分割为区间,10babxxxan:,)(上满足条件在区间如果函数baxS1.4.1、三次样条插值函数25谢谢观赏2019-8-232()
23、s x由条件(),不妨将记为1,1,2,.,iiisxs x xx xin()=(),32()(1)iiiixa xb xc xdisiiiiabcd其中,为待定系数,共4n个。1由条件(),有()()()()(1,2,.,1)(2)()()iiiiiixxxxinxxii+1ii+1ii+1ssssss26谢谢观赏2019-8-233由条件(),有()(0,1,2,.,)(3)iiis xyin 2342n容易看出,()和()共有个方程,为确定s(x)的4n个待定参数,尚需再给出两个条件,即所谓边界条件。通常使用的边界条件有以下三类:000,nnnxfxfff第一类边界条件是s()=s()=
24、为给定的值。27谢谢观赏2019-8-2300000()nnnnnf xx-xs xx-xs xs xs xs xs xs x第三类边界条件是周期条件。设()是周期函数,不妨设以为一个周期,这时也应以为周期的周期函数,于是 s(x)在端点处满足条件:(+0)=(-0);(+0)=(-0);(+0)=(-0).000nnnxfxfff第二类边界条件是s()=s()=,为给定的值。0=0nxx当s()=s()时,样条函数在两端点不受力,呈自然状态,故称之为自然边界条件。28谢谢观赏2019-8-234()4().ns xns x 利用个条件求出三次样条函数的个待定常数,直接求解计算量很大,通常利用
25、Matlab软件求例2设f(x)为定义在0,3上的函数,有下列函数值表xi0123yi00.521.503()0.2,()1,0,3().fxfxs x 且试求区间上满足上述条件的三样次条插值函数解 matlab求解s(x).程序为:clearx0=0 1 2 3;y0=0 0.5 2 1.5;x=0:0.1:3;pp1=csape(x0,y0,complete);y3=ppval(pp1,x);%计算插值函数在x处的值plot(x0,y0,+,x,y3,r)29谢谢观赏2019-8-23pp=csape(x,y,complete)breaks,coefs,npolys,ncoefs,dim=
展开阅读全文