人工神经网络5BP神经网络课件-3.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《人工神经网络5BP神经网络课件-3.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人工 神经网络 BP 课件 _3
- 资源描述:
-
1、武汉科技大学1人工神经网络(Artifical Neural Network)张凯 副教授武汉科技大学 计算机学院2第五章第五章 BP神经网络神经网络1.研究背景研究背景2.学习规则学习规则3.感知机结构感知机结构4.感知机学习规则感知机学习规则研究背景研究背景罗斯布莱特的感知机学习规则和伯纳德和玛西娅的 LMS 算法是设计用来训练单层的类似感知器的网络的。如前面几章所述,这些单层网络的缺点是只能解线性可分的分类问题。罗斯布莱特和伯纳德均意识到这些限制并且都提出了克服此类问题的方法:多层网络。但他们未将这类算法推广到用来训练功能更强的网络。研究背景研究背景韦伯斯(Werbos)在他1974年博
2、士的论文中第一次描述了训练多层神经网络的一个算法,论文中的算法是在一般网络的情况中描述的,而将神经网络作为一个特例。论文没有在神经网络研究圈子内传播。研究背景研究背景直到20 世纪80 年代中期,反向传播算法才重新被发现并广泛地宣扬,这个算法因被包括在并行分布式处理(Parallel Distributed Processing)RuMc86一书中而得到普及,才使之成为迄今为止最著名的多层网络学习算法BP 算法,由此算法训练的神经网络,称之为BP 神经网络。研究背景研究背景David Rumelhart J.McClelland 研究背景研究背景BP 网络广泛应用于函数逼近、模式识别/分类、数
3、据压缩等,80%-90%的人工神经网络模型是采用BP网络或它的变化形式,它也是前馈网络的核心部分,体现了人工神经网络最精彩的部分。异或异或问题问题x1x2y000110110110多层网络求解异或问题多层网络求解异或问题 1,01,0 xf xx输出函数:用一个简单的三层感知器就可得到解决多层网络求解异或问题多层网络求解异或问题x1+x2+0.5=0 x1+x2-1.5=00.7*y1-0.4y2-1=0多层网络求解异或问题多层网络求解异或问题BP神经元及神经元及BP网络模型网络模型BP神经元及神经元及BP网络模型网络模型 BP神经元与其他神经元类似,不同的是BP神经元的传输函数为非线性函数,
4、最常用的函数是logsig 和tansig函数,其输出为:BP神经元及神经元及BP网络模型网络模型BP神经元及神经元及BP网络模型网络模型BP网络一般为多层神经网络。由BP神经元构成的二层网络如图所示,BP网络的信息从输入层流向输出层,因此是一种多层前馈神经网络。BP神经元及神经元及BP网络模型网络模型如果多层BP 网络的输出层采用S形传输函数(如logsig),其输出值将会限制在较小的范围内(0,l);用线性传输函数则可以取任意值。BP神经元及神经元及BP网络模型网络模型1111(),0,1,.,1mmmmmafWabmM0ap前一层的输出是后一层的输入 网络的输入 Maa网络的输出 BP神
5、经元及神经元及BP网络模型网络模型BP网络的学习网络的学习 在确定了BP网络的结构后,要通过输入和输出样本集对网络进行训练,亦即对网络的阈值和权值进行学习和修正,以使网络实现给定的输入/输出映射关系。BP网络的学习网络的学习BP 网络的学习过程分为两个阶段:第一个阶段是输入已知学习样本,通过设置的网络结构和前一次迭代的权值和阈值,从网络的第一层向后计算各神经元的输出。第二个阶段是对权值和阈值进行修改,从最后一层向前计算各权值和阈值对总误差的影响(梯度),据此对各权值和阈值进行修改。BP网络的学习网络的学习 以上两个过程反复交替,直到达到收敛为止。由于误差逐层往回传递,以修正层与层间的权值和阈值
6、,所以称该算法为误差反向专播(error back propagation)算法,这种误差反传学习算法可以推广到有若干个中间层的多层网络,因此该多层网络常称之为BP 网络。BP网络的学习网络的学习 标准的BP 算法也是一种梯度下降学习算法,其权值的修正是沿着误差性能函数梯度的反方向进行的。针对标准BP 算法存在的一些不足,出现了几种基于标准BP算法的改进算法,如变梯度算法、牛顿算法等。函数逼近函数逼近 直到现在为止,在本书中看到的神经网络的应用多是在模式分类方面。神经网络在本质上也可被看作是函数逼近器。例如,在控制系统中,目标是要找到一个合适的反馈函数。应用举例应用举例求解函数逼近问题 有21
7、组单输入矢量和相对应的目标矢量,试设计神经网络来实现这对数组的函数关系2022-11-1623函数逼近函数逼近 它能将测量到的输出映射为控制输入。考虑图中的两层的1-2-1网络。函数逼近函数逼近此例中,第一层的传输函数是logsig函数第二层的是线性函数。11()1nfne2()fnn函数逼近函数逼近 注意网络的响应包括两步,每一步对第一层中的一个logsig形神经元的响应。通过调整网络的参数,每一步的曲线形状和位置都可以发生改变,如在下面讨论中将会见到的那样。函数逼近函数逼近目标矢量相对于输入矢量的图形 初始网络的输出曲线 2022-11-1627函数逼近函数逼近2022-11-1628训练
8、1000次 训练2000次函数逼近函数逼近2022-11-1629训练3000次 训练5000次函数逼近函数逼近 从这个例子中,可以看到多层网络的灵活性。看起来,只要在隐层中有足够数量的神经元,我们可以用这样的网络来逼近几乎任何一个函数。事实上,研究已表明两层网络在其隐层中使用S形传输函数,在输出层中使用线性传输函数,就几乎可以以任意精度逼近任何感兴趣的函数,只要隐层中有足够的单元可用(Host89)。函数逼近函数逼近 我们已经有了对多层感知机网络在模式识别和函数逼近中的能力一些概念,下一步是要设计一个算法来训练这样的网络。反向传播算法反向传播算法反向传播算法反向传播算法 如前所述,多层网络中
9、某一层的输出成为下一层的输入。描述此操作的等式为:这里,M是网络的层数。第一层的神经元从外部接收输入:它是等式的起点。最后一层神经元的输出是网络的输出:1111(),0,1,1mmmmmmMafW ab0a=pMa=a多层网络的BP算法是 LMS 算法的推广。两个算法均使用相同的性能指数:均方误差。算法的输入是一个网络正确行为的样本集合:1 ,12 ,2 ,QQptptpt221111()()()QQkkmsee kt ka kQQ这里是网络的输入,是对应的目标输出。每输入一个样本,便将网络输出与目标输出相比较。算法将调整网络参数以使均方误差最小化:性能指数性能指数 近似误差的最速下降法为,这
10、里 是学习速度。22()()()()F xe kt ka k,(1)()mmi ji jmi jFwkwkw(1)()mmiimiFbkbkb性能指数性能指数 这里,x是网络权值和偏置值的向量。若网络有多个输出,则上式的一种形式为:这里,均方误差的期望值被第k次迭代时的均方误差所代替。敏感性的反向传播敏感性的反向传播 现在还需要计算敏感性,正是这个过程给出了反向传播这个词,因为它描述了第m层的敏感性通过第m+1层的敏感性来计算的递推关系。,(1)()mmi ji jmi jFwkwkw误差不是隐层中的权值的显式函数偏导数不易求得22()()()()F xe kt ka k1111(),0,1,
11、.,1mmmmmafWabmM链法则链法则链法则计算隐层偏导数()()()df n wdf ndn wdwdndw设有一个函数 f,它是变量n的显示函数。函数n是w的显示函数。现在球 f 关于第三个变量w的导数。若()()()(2)ndf n wdf ndn wedwdndw(),2nf ne nw链法则链法则,mimmmi jii jnFFwnwmimmmiiinFFbnb11,1mSmmmmii jjijnw ab1,mmijmi jnaw1miminb梯度计算梯度计算,mimmmi jii jnFFwnwmimmmiiinFFbnb11,1mSmmmmii jjijnw ab1,mmij
展开阅读全文