《新编MATLAB&Simulink自学一本通》课件第20章 多项式回归与数据插值.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《《新编MATLAB&Simulink自学一本通》课件第20章 多项式回归与数据插值.ppt》由用户(momomo)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 新编MATLAB&Simulink自学一本通 新编MATLAB&Simulink自学一本通课件第20章 多项式回归与数据插值 新编
- 资源描述:
-
1、2023-5-5主要内容主要内容 多项式回归多项式回归 插值问题的数学描述插值问题的数学描述 一维插值一维插值 二维插值二维插值 高维插值高维插值2023-5-5第一节第一节 多项式回归多项式回归2023-5-5一、多项式回归模型一、多项式回归模型11212,(0,),1,2,.nniiininiiidiyp xp xp xpNim2023-5-5二、多项式回归的二、多项式回归的MATLAB实现实现 p,S,mu=polyfit(x,y,n)自变量观测值向量自变量观测值向量因变量观测值向量因变量观测值向量多项式阶数多项式阶数1.polyfit函数的用法函数的用法系数向量的估计值系数向量的估计值
2、用于误差估计的结构体变量用于误差估计的结构体变量均值和标准差均值和标准差2023-5-5 y,delta=polyval(p,x,S)用户指定的自变量取值向量用户指定的自变量取值向量因变量估计值向量因变量估计值向量2.polyval函数的用法函数的用法多项式系数向量多项式系数向量用于误差估计的结构体变量用于误差估计的结构体变量误差标准差的估计值向量误差标准差的估计值向量2023-5-5 r=poly2sym(p,v)多项式的符号表达式多项式的符号表达式3.poly2sym函数的用法函数的用法多项式系数向量多项式系数向量自变量符号或取值自变量符号或取值2023-5-5三、多项式回归案例三、多项式
3、回归案例【例例20.1-1】现有我国现有我国2007年年1月至月至2011年年11月的食品零售价格分月的食品零售价格分类指数数据,如表类指数数据,如表20.1-1所示。数据来源:中华人民共和国国家所示。数据来源:中华人民共和国国家统计局网站月度统计数据。试根据这统计局网站月度统计数据。试根据这59组统计数据研究全国食组统计数据研究全国食品零售价格分类指数品零售价格分类指数 y(上年同月(上年同月=100)和时间)和时间 x 之间的关系。之间的关系。序号序号统计月度统计月度上年同月上年同月=100上年同期上年同期=100全国全国城市城市农村农村全国全国城市城市农村农村12007年1月104.91
4、04.4105.9104.9104.4105.922007年2月105.8105.2106.9105.3104.8106.432007年3月107.7107.4108.3106.1105.7107572011年9月113.5113.4114112.6112.4113.1582011年10月111.9111.8112.2112.5112.3113592011年11月108.7108.8108.6112.2112112.62023-5-51.数据的散点图数据的散点图951001051101151201252007.12007.32007.52007.72007.92007.112008.12008
5、.32008.52008.72008.92008.112009.12009.32009.52009.72009.92009.112010.12010.32010.52010.72010.92010.112011.12011.32011.52011.72011.92011.11时间(x)食品零售价格分类指数(y)2023-5-52.四次多项式拟合四次多项式拟合 假设假设 y 关于关于 x 的理论回归方程为的理论回归方程为43212345 yp xp xp xp xp 调用调用polyfit函数求系数估计值函数求系数估计值 p4=polyfit(x,y,4)p4=-0.0001 0.0096 -0
6、.3985 5.5635 94.2769 r=poly2sym(p4);r=vpa(r,5)r=-0.000074268*x4+0.0096077*x3-0.39845*x2+5.5635*x+94.2774320.00010.00960.39855.563594.2769yxxxx 2023-5-53.更高次多项式拟合更高次多项式拟合 调用调用polyfit函数作更高次(大于函数作更高次(大于4次)多项式拟合,并把次)多项式拟合,并把多次拟合的残差的模加以对比,评价拟合的好坏。多次拟合的残差的模加以对比,评价拟合的好坏。p5,S5=polyfit(x,y,5);%5次多项式拟合次多项式拟合
7、S5.normr p6,S6=polyfit(x,y,6);%6次多项式拟合次多项式拟合 S6.normr p7,S7=polyfit(x,y,7);%7次多项式拟合次多项式拟合 S7.normr p8,S8=polyfit(x,y,8);%8次多项式拟合次多项式拟合 S8.normr p9,S9=polyfit(x,y,9);%9次多项式拟合次多项式拟合 S9.normr2023-5-54.拟合效果图拟合效果图 在以上拟合结果的基础上,可以调用在以上拟合结果的基础上,可以调用polyval函数计算给函数计算给定自变量定自变量 处的因变量处的因变量 的预测值,从而绘制拟合效果图,的预测值,从而
8、绘制拟合效果图,从拟合效果图上直观地看出拟合的准确性。从拟合效果图上直观地看出拟合的准确性。代码略。代码略。2023-5-5951001051101151201252007.12007.32007.52007.72007.92007.112008.12008.32008.52008.72008.92008.112009.12009.32009.52009.72009.92009.112010.12010.32010.52010.72010.92010.112011.12011.32011.52011.72011.92011.11时间(x)食品零售价格分类指数(y)原始散点4次多项式拟合6次多项
9、式拟合8次多项式拟合9次多项式拟合2023-5-5第二节第二节 插值问题的数学描述插值问题的数学描述2023-5-5一、什么是插值一、什么是插值 所谓插值就是在已知离散数据的基础上补插连续函数,所谓插值就是在已知离散数据的基础上补插连续函数,使得这条连续曲线(或曲面)通过全部已知的离散数据点,使得这条连续曲线(或曲面)通过全部已知的离散数据点,利用插值方法可通过函数在有限个点处的取值状况,估算利用插值方法可通过函数在有限个点处的取值状况,估算出函数在其他点处的近似值。出函数在其他点处的近似值。一维插值问题的一维插值问题的数学描述数学描述为:为:已知某一函数已知某一函数 y=g(x)(g(x)的
10、解析表达式可能十分复杂的解析表达式可能十分复杂,也可以是未知的)在区间也可以是未知的)在区间a,b上上n+1个互异点个互异点 xj 处的函数值处的函数值 y j,j=0,1,n,还知道,还知道g(x)在在a,b上有若干阶导数,如何上有若干阶导数,如何求出求出g(x)在在a,b上任一点上任一点x的近似值。的近似值。二、一维插值问题的数学描述二、一维插值问题的数学描述数学描述数学描述 一维插值方法的一维插值方法的基本思想基本思想是:根据是:根据g(x)在区间在区间a,b上上n+1个互异点个互异点 x j(称为(称为节点节点)的函数值)的函数值 y j,j=0,1,n,求,求一个足够光滑、简单便于计
11、算的函数一个足够光滑、简单便于计算的函数f(x)(称为插值函数)(称为插值函数)作为作为g(x)的近似表达式,使得的近似表达式,使得f(x j)=y j,j=0,1,n。(1)然后计算然后计算f(x)在区间在区间a,b(称为插值区间称为插值区间)上点上点x(称为(称为插值插值点点)的值作为原函数)的值作为原函数g(x)(称为被插函数)在此点的近似(称为被插函数)在此点的近似值。求插值函数值。求插值函数f(x)的方法称为插值方法,(的方法称为插值方法,(1)式称为插值)式称为插值条件条件。代数多项式比较简单,常用多项式作为插值函数。代数多项式比较简单,常用多项式作为插值函数。2基本思想基本思想
12、常用的一维插值方法有:常用的一维插值方法有:分段线性插值分段线性插值、拉格朗日拉格朗日(Lagrange)多项式插值)多项式插值、牛顿(牛顿(Newton)插值)插值、Hermite插值插值、最近邻插值最近邻插值、三次样条插值三次样条插值和和B样条插值样条插值等。等。3常用一维插值方法常用一维插值方法 二二维插值问题的维插值问题的数学描述数学描述为:为:已知某已知某二元二元函数函数 z=G(x,y)(解析表达式可能十分复杂解析表达式可能十分复杂,也可以是未知的)在也可以是未知的)在平面区域平面区域D上上N个互异点个互异点(xi,yi)处的函数处的函数值值 zi,i=0,1,N,求,求一个足够光
13、滑、简单便于计算的插一个足够光滑、简单便于计算的插值函数值函数f(x,y)。由插值函数可以计算原函数在平面区域。由插值函数可以计算原函数在平面区域 上任上任意点处的近似值。意点处的近似值。常用的二维插值方法常用的二维插值方法有:分片线性插值、有:分片线性插值、双线性插值、最近邻插值、三次样条插值和双线性插值、最近邻插值、三次样条插值和B样条插值等。样条插值等。三、二维插值问题的数学描述三、二维插值问题的数学描述 是一个细的、可弯曲的木制或塑料条,在飞机或轮是一个细的、可弯曲的木制或塑料条,在飞机或轮船等的设计制造过程中为描绘出光滑的外形曲线船等的设计制造过程中为描绘出光滑的外形曲线(放样放样)
14、所用的工具所用的工具 从物理上讲,样条满足插值点的约束,同时使势能从物理上讲,样条满足插值点的约束,同时使势能达到最小达到最小 三次样条本质上是一段一段的三次多项式拼合而成三次样条本质上是一段一段的三次多项式拼合而成的曲线,在拼接处的曲线,在拼接处,不仅函数是连续的不仅函数是连续的,且一阶和二阶导且一阶和二阶导数也是连续的数也是连续的,19461946年年,Schoenberg,Schoenberg将样条引入数学将样条引入数学,即即所谓的所谓的样条函数样条函数1.什么是样条?什么是样条?四、三次样条插值的数学描述四、三次样条插值的数学描述()(),S xf xa b三三次次样样则则条条称称为为
15、在在上上的的插插值值函函数数(2)(),(),(),S xS xSxa b 都都在在区区间间上上连连续续1(1)(),iiS xxx 在在每每个个小小区区间间上上都都是是三三次次多多项项式式(),S xa b则则称称为为区区间间上上的的三三次次样样条条函函数数(3)()S x若若三三次次样样条条函函数数满满足足(),0,1,iif xy in(),0,1,iiS xy in01,naxxxba b为为区区间间的的一一个个分分割割(),:S xa b如如果果函函数数在在区区间间上上满满足足条条件件2.三次样条插值函数三次样条插值函数3.三次样条插值原理三次样条插值原理niyxSii,1,0,)(
16、在在n n个小区间构造个小区间构造S(x)S(x),共有,共有n n个三次多项式,需确定个三次多项式,需确定4n4n个参数个参数1,1,)()(limniyxSxSiixxi1,1),()(limnixSxSixxi1,1,)()(lim niMxSxSiixxi在所有节点上在所有节点上n+1个方程个方程在除端点外的节点上在除端点外的节点上3(n-1)个方程个方程这样就得到这样就得到4n-2个方程,为保证待定参数的唯一性,还差两个个方程,为保证待定参数的唯一性,还差两个方程。为此,常用的方法是对边界节点除函数值外附加要求,方程。为此,常用的方法是对边界节点除函数值外附加要求,这就是所谓的边界条
17、件。根据实际问题的不同,三次样条插值这就是所谓的边界条件。根据实际问题的不同,三次样条插值常用到下列常用到下列三类边界条件三类边界条件。r 周期边界条件:周期边界条件:当当y=g(x)是以是以 b-a=x0 -xn 为周期的周期函数时,要求为周期的周期函数时,要求S(x)也是周期函数,故端点处要满足也是周期函数,故端点处要满足此条件称为周期条件。此条件称为周期条件。r m边界条件:边界条件:即给定端点处的一阶导数值。即给定端点处的一阶导数值。00(),()nnS xyS xyr M边界条件:边界条件:即给定端点处的二阶导数值。即给定端点处的二阶导数值。00(),()nnSxySxy(0)(0)
18、,(0)(0)S aS bS aS b2023-5-5第三节第三节 一维插值一维插值一、一、Lagrange(拉格朗日)(拉格朗日)插值插值1拉格朗日线性插值拉格朗日线性插值插值多项式:插值多项式:101()L xaa x011011kkkkyaa xyaa x直线的两点式表达式直线的两点式表达式1111kkkkkkkkxxxxyyxxxx1111(),()kkkkkkkkxxxxlxlxxxxx分别称为节点分别称为节点x0和和x1的一次的一次插值插值基函数基函数插值函数为基函数的线性组合,组合系数插值函数为基函数的线性组合,组合系数就是对应节点上的函数值就是对应节点上的函数值111()()k
19、kkkkkyyL xxxyxx在在 上,过点上,过点11(,),(,)kkkkxyxy1,kkxx2.拉格朗日二次插值拉格朗日二次插值二次插值多项式:二次插值多项式:21111()()()()kkk kkkL xylxy lxylx对于对于 ,可假定:,可假定:1,()()0,()iiixxl xxxx在节点上,但基函数满足:基函数满足:11111()()(),()()kkkkkkkxxxxlxxxxx基函数如何确定?基函数如何确定?1111()()(),()()kkkkkkkxxxxlxxxxx11111()()()()()kkkkkkkxxxxlxxxxx从而从而过点过点1111(,),(
20、,),(,)kkkkkkxyxyxyik11()()()kkklxA xxxx111()()kkkkAxxxxr 构造一组插值基函数(构造一组插值基函数(n次次多项式多项式)011011()()()()()()()()()iiniiiiiiinxxxxxxxxl xxxxxxxxx缺点:缺点:当当 n 比较大时,插值多项式比较大时,插值多项式Ln(x)的收敛性与稳定性变的收敛性与稳定性变 差,逼近效果不理想。差,逼近效果不理想。li(x)是是 n次次多项式多项式,且满足,且满足0()1ijijl xijr 由插值基函数由插值基函数li(x)构造构造 n次拉格朗日插值次拉格朗日插值多项式多项式如
21、下:如下:0()()nni iiL xyl x3.拉格朗日拉格朗日n 次插值次插值r 拉格朗日拉格朗日n次插值的误差估计次插值的误差估计拉格朗日插值产生的截断误差为拉格朗日插值产生的截断误差为Rn(x),则,则()()()nnR xg xL x(1)1()()()()()(1)!nnnngR xg xL xxn10()()nniixxx1()()(1)!nnMR xxn(1)()ngM4.自编拉格朗日插值函数自编拉格朗日插值函数lagrangefunction y=lagrange(x0,y0,x)if numel(x0)=numel(y0)error(原始坐标点应等长原始坐标点应等长)end
22、x0=x0(:);if any(diff(sort(x0)=0)error(插值节点不能有重复值插值节点不能有重复值)endn=numel(x0);m=numel(x);y0=y0(:);x=x(:);y=zeros(n,m);for i=1:n y(i,:)=y0(i)*prod(repmat(x,n-1,1)-.repmat(x0(1:n=i),1,m)/prod(x0(i)-x0(1:n=i);endy=sum(y);2023-5-5【例例20.3-1】Runge(龙格)现象:用函数(龙格)现象:用函数 在在区间区间-1,1 上产生上产生11个等距节点,然后调用自编个等距节点,然后调用自
23、编lagrange函数作函数作拉格朗日插值。拉格朗日插值。2()1(125)f xx-1-0.500.51-0.500.511.52Xf(x)=11+25x2 插值节点原函数图像Lagrange插值 x0=linspace(-1,1,11);y0=1./(1+25*x0.2);x=linspace(-1,1,100);f=1./(1+25*x.2);y=lagrange(x0,y0,x);plot(x0,y0,ko);hold on;plot(x,f,k,linewidth,2);plot(x,y,k:,linewidth,2);xlabel(X);ylabel($f(x)=frac11+25
24、x2$,Interpreter,latex);legend(插值节点插值节点,原函数图像原函数图像,Lagrange插值插值)2023-5-5二、二、interp1函数函数 yi=interp1(x,Y,xi,method)自变量观测值向量自变量观测值向量因变量观测值向量因变量观测值向量用户指定的插值点横坐标用户指定的插值点横坐标1.interp1函数的用法函数的用法计算得到的近似函数值计算得到的近似函数值指定所用的插值方法指定所用的插值方法2023-5-5【例例20.3-1续续】针对例针对例20.3-1中的数据,调用中的数据,调用interp1函数作一维函数作一维插值。插值。ylin=int
展开阅读全文